부트캠프 [내일배움캠프] TIL 모음
[내일배움캠프]PM2기_ai 특강 1 회차/기획자가 알고가면 좋은 AI 개념 정리
pm0012
2025. 6. 3. 10:12
ai 특강 솔직히 핵심에 대한 내용이 없어 너무 실망스러웠다.
나는 그래서 내가 알고싶은 부분에 대해서 좀 더 알아보기로 했다.
그래도 특강에서 이 다이어그램을 제시해준 덕분에 머신러닝와 딥러닝을 비교해 봐야겠다는 생각이 들었다 .
🏗️ 머신러닝과 딥러닝 비교
구분 머신러닝(ML) 딥러닝(DL)
핵심 기술 | - 지도학습, 비지도학습, 강화학습- 의사결정나무, SVM, KNN, 랜덤 포레스트 등- 특성(Feature) 추출 및 선택 | - 인공신경망(ANN), CNN, RNN, Transformer 등- 대규모 데이터 처리- 자동 특성 추출 |
핵심 특징 | - 비교적 적은 데이터로 학습 가능- Feature Engineering(전처리 및 특징 추출)이 필요- 해석 가능성 높음- 계산 자원 소모 적음 | - 대용량 데이터 학습 가능- 자동으로 Feature 학습- 해석 난이도 높음(Black Box 문제)- 연산량과 자원 소모 많음 |
주요 사용 사례 | - 신용평가, 사기 탐지, 추천 시스템- 스팸 필터링, 가격 예측, 고객 이탈 분석 | - 이미지 분류, 음성 인식, 자연어 처리- 자율주행, 챗봇, 얼굴 인식, 번역 |
서비스 예시 | - Netflix 추천 알고리즘- 카드사의 이상거래 탐지- 아마존 가격 예측 | - 구글 번역, Siri, Alexa- Tesla 자율주행- ChatGPT(Transformer 기반) |
💡 정리 및 비교 포인트
✅ 머신러닝은 데이터의 특징을 사람이 정리해 입력해야 하고, 적은 데이터로도 효과적입니다. 비교적 단순하고 해석이 용이하여 금융, 마케팅 분야 등에서 활용됩니다.
✅ 딥러닝은 대규모 데이터와 고성능 컴퓨팅이 필요하지만, 복잡한 패턴 인식에 강합니다. 이미지, 음성, 자연어 등 비정형 데이터를 다루며, 자동으로 중요한 특징을 추출합니다.
🛠️ 둘을 융합한 사례
- 예: 하이브리드 AI 서비스 (예: 신용평가에서 머신러닝으로 기본 위험도 예측 후, 딥러닝으로 비정형 데이터(예: SNS, 음성 등) 보강)
그럼 이를 바탕으로 내가 어떤 역량을 키울수 있을까 ?
PM(프로덕트 매니저) 관점에서 머신러닝을 활용하면 데이터 기반 설득력과 문제 해결 능력을 강화하자!
🧠 머신러닝으로 PM 역량 강화하기
💡 1️⃣ 머신러닝을 이용한 설득의 근거
- 머신러닝은 데이터를 정량적으로 분석해 패턴을 찾고 예측을 합니다. PM으로서 이런 분석 결과를 근거로 사용자 행동/시장 반응/리스크를 예측해 다른 Stakeholder(디자이너, 개발자, 경영진 등)을 설득할 수 있어요.
- 예를 들어:
- A/B 테스트 결과를 머신러닝으로 분석 → 승자 로직/서비스 개선안 제시
- 이탈률 예측 모델로 특정 UI 변경의 효과를 설명
- 사용자 세분화(클러스터링 등)를 통해 마케팅 타겟 정의
🚀 2️⃣ 머신러닝을 활용한 PM 성장 방법
단계 구체적 액션
🔍 데이터 이해 및 수집 | - PM이 스스로 사용자 로그, KPI 지표를 이해하고 분석- 간단한 SQL, Python으로 데이터 추출 |
📊 ML 알고리즘 실습 | - 의사결정나무, 회귀 분석, 클러스터링 등 단순 모델을 실습- AutoML 도구(예: Google AutoML, Azure ML)로 빠른 프로토타이핑 |
📈 인사이트 도출 및 설득 | - 모델 결과를 데이터 시각화 (예: Tableau, PowerBI)- ‘왜 이 기능이 필요하고, 어느 정도 개선될 것인지’ 구체적 수치 제시 |
🤝 Stakeholder와 협업 강화 | - 데이터를 이해하는 언어로 소통- 비즈니스 문제를 데이터로 풀어내어 신뢰 구축 |
📚 지속 학습 | - 머신러닝의 원리 이해 (ex. 모델 과적합 방지, 성능 지표 이해)- 비즈니스/사용자 관점에서 ‘데이터의 의미’를 해석하는 역량 키우기 |
🌟 3️⃣ PM으로서 머신러닝을 사용하는 이유
✅ 단순 직관이 아니라 정량적 근거로 의사결정
✅ 서비스 개선의 ROI를 수치로 표현 가능
✅ Stakeholder 간 신뢰도 및 설득력 강화
✅ 데이터 기반으로 사용자 경험을 예측 및 최적화
📌 결론
- PM이라면 머신러닝을 단순한 모델링 도구가 아닌, 비즈니스와 사용자 문제를 푸는 도구로 활용.
- 단순히 모델을 만들기보다, “이 데이터로 어떤 문제를 풀까?” “이 인사이트를 어떻게 서비스 전략으로 연결할까?” 에 집중하면 PM으로서의 데이터 리더십을 향상가능 .
단계 PM 성장 머신러닝 학습
1️⃣ 기초 이해 | - 제품 기획, 사용자 중심 사고, 문제 정의- KPI, 지표 관리 이해 | - ML 개념 이해(지도/비지도 학습, 분류/회귀)- Python, SQL 기본 |
2️⃣ 데이터 분석 활용 | - 데이터 기반 의사결정 연습- 간단한 A/B 테스트 기획 및 해석 | - Pandas, Scikit-learn 사용- 의사결정나무, 로지스틱 회귀 실습 |
3️⃣ ML 도입 실습 | - 비즈니스 문제와 데이터 연결 시도- 사용자 세그먼트 정의, 페르소나 기반 기획 | - AutoML 도구 사용- 사용자 이탈 예측, 사용자 군집화 |
4️⃣ 설득 및 확장 | - 분석 결과를 시각화 및 스토리텔링- Stakeholder 설득 경험 쌓기 | - ML 성능 평가 및 개선 이해- Overfitting, 성능지표(F1, AUC 등) 학습 |
5️⃣ 데이터 리더십 | - 데이터 기반 비즈니스 전략 수립- 조직 내 데이터 문화 확산 | - ML+비즈니스 문제 해결 프로젝트- ML 모델의 비즈니스 가치 평가 |
- 머신러닝 학습1️⃣ 지도학습(Supervised Learning)
- 주어진 **정답(라벨)**을 기준으로 학습하고, 새로운 데이터에 대해 예측을 수행.
- 대표 알고리즘:
- 선형회귀, 로지스틱회귀
- 의사결정나무, 랜덤 포레스트
- 서포트 벡터 머신(SVM)
- 활용 예시: 스팸 메일 분류, 고객 이탈 예측
2️⃣ 비지도학습(Unsupervised Learning)- 정답 없이 데이터 간의 유사성/패턴을 찾아내는 학습.
- 대표 알고리즘:
- K-means 클러스터링
- 주성분 분석(PCA)
- DBSCAN
- 활용 예시: 고객 세분화, 이상치 탐지
3️⃣ 강화학습(Reinforcement Learning)- 행동-보상 기반 학습: 환경에서 시도하고, 보상을 최대화하도록 학습.
- 대표 알고리즘:
- Q-learning, Deep Q Network(DQN)
- 정책 경사법(Policy Gradient)
- 활용 예시: 게임 AI, 로봇 제어, 추천 시스템 최적화
💡 이 3가지 학습 방식 외에도 머신러닝의 핵심 기술에는:- 피처 엔지니어링(Feature Engineering): 데이터를 사람이 이해할 수 있도록 가공.
- 모델 평가 및 튜닝: 교차 검증, 하이퍼파라미터 최적화 등.
- 데이터를 분할하며 분류 또는 회귀 문제를 해결하는 트리 기반 모델.
- 데이터의 **특징(Feature)**를 기준으로 **조건문(if-else)**처럼 나누어 트리를 형성.
- 트리의 **루트(시작)**에서 **리프(끝)**까지 내려가면서 최종 예측 결정.
- 🌟 장점:
- 이해하기 쉽고 시각화가 가능.
- 적은 데이터로도 빠른 학습.
- ⚠️ 단점:
- 과적합(overfitting) 가능성 큼.
- 작은 데이터 변화에 민감.
🌲 랜덤포레스트(Random Forest)- 여러 개의 의사결정나무를 무작위로 생성해 다수결 방식으로 결과를 결정하는 앙상블(Ensemble) 기법.
- 각 트리는 데이터와 특징을 랜덤하게 선택해 학습.
- 🌟 장점:
- 과적합 방지 (다양한 트리를 조합).
- 안정적이고 예측 성능 우수.
- 다양한 데이터 타입(숫자, 범주형) 처리 가능.
- ⚠️ 단점:
- 단일 트리보다 학습 및 예측 속도 느림.
- 해석이 복잡해짐.
🖼️ 간단한 비유- 의사결정나무: 하나의 판사(한 명의 트리)가 규칙을 정해 판단.
- 랜덤포레스트: 여러 명의 판사(여러 트리)가 각각 독립적으로 판단하고, 다수결로 결정.
💡 한 줄 요약- 의사결정나무: 데이터를 if-else 규칙으로 나눠 최종 예측하는 간단한 트리 모델.
- 랜덤포레스트: 다수의 의사결정나무를 결합해 안정적이고 정확한 예측을 수행하는 모델.
- 🏗️ 머신러닝의 핵심 기술