부트캠프 [내일배움캠프] TIL 모음

[내일배움캠프]PM2기_ai 특강 1 회차/기획자가 알고가면 좋은 AI 개념 정리

pm0012 2025. 6. 3. 10:12

ai  특강 솔직히 핵심에 대한 내용이 없어 너무 실망스러웠다.

나는 그래서 내가 알고싶은 부분에 대해서 좀 더 알아보기로 했다. 

 

 

그래도 특강에서 이 다이어그램을 제시해준 덕분에 머신러닝와 딥러닝을 비교해 봐야겠다는 생각이 들었다 . 

 

🏗️ 머신러닝과 딥러닝 비교

구분 머신러닝(ML) 딥러닝(DL)

핵심 기술 - 지도학습, 비지도학습, 강화학습- 의사결정나무, SVM, KNN, 랜덤 포레스트 등- 특성(Feature) 추출 및 선택 - 인공신경망(ANN), CNN, RNN, Transformer 등- 대규모 데이터 처리- 자동 특성 추출
핵심 특징 - 비교적 적은 데이터로 학습 가능- Feature Engineering(전처리 및 특징 추출)이 필요- 해석 가능성 높음- 계산 자원 소모 적음 - 대용량 데이터 학습 가능- 자동으로 Feature 학습- 해석 난이도 높음(Black Box 문제)- 연산량과 자원 소모 많음
주요 사용 사례 - 신용평가, 사기 탐지, 추천 시스템- 스팸 필터링, 가격 예측, 고객 이탈 분석 - 이미지 분류, 음성 인식, 자연어 처리- 자율주행, 챗봇, 얼굴 인식, 번역
서비스 예시 - Netflix 추천 알고리즘- 카드사의 이상거래 탐지- 아마존 가격 예측 - 구글 번역, Siri, Alexa- Tesla 자율주행- ChatGPT(Transformer 기반)

💡 정리 및 비교 포인트

✅ 머신러닝은 데이터의 특징을 사람이 정리해 입력해야 하고, 적은 데이터로도 효과적입니다. 비교적 단순하고 해석이 용이하여 금융, 마케팅 분야 등에서 활용됩니다.

✅ 딥러닝은 대규모 데이터와 고성능 컴퓨팅이 필요하지만, 복잡한 패턴 인식에 강합니다. 이미지, 음성, 자연어 등 비정형 데이터를 다루며, 자동으로 중요한 특징을 추출합니다.


🛠️ 둘을 융합한 사례

  • 예: 하이브리드 AI 서비스 (예: 신용평가에서 머신러닝으로 기본 위험도 예측 후, 딥러닝으로 비정형 데이터(예: SNS, 음성 등) 보강)

 

그럼 이를 바탕으로 내가 어떤 역량을 키울수 있을까 ? 

 

PM(프로덕트 매니저) 관점에서 머신러닝을 활용하면 데이터 기반 설득력 문제 해결 능력을 강화하자!


🧠 머신러닝으로 PM 역량 강화하기

💡 1️⃣ 머신러닝을 이용한 설득의 근거

  • 머신러닝은 데이터를 정량적으로 분석해 패턴을 찾고 예측을 합니다. PM으로서 이런 분석 결과를 근거로 사용자 행동/시장 반응/리스크를 예측해 다른 Stakeholder(디자이너, 개발자, 경영진 등)을 설득할 수 있어요.
  • 예를 들어:
    • A/B 테스트 결과를 머신러닝으로 분석 → 승자 로직/서비스 개선안 제시
    • 이탈률 예측 모델로 특정 UI 변경의 효과를 설명
    • 사용자 세분화(클러스터링 등)를 통해 마케팅 타겟 정의

🚀 2️⃣ 머신러닝을 활용한 PM 성장 방법

단계 구체적 액션

🔍 데이터 이해 및 수집 - PM이 스스로 사용자 로그, KPI 지표를 이해하고 분석- 간단한 SQL, Python으로 데이터 추출
📊 ML 알고리즘 실습 - 의사결정나무, 회귀 분석, 클러스터링 등 단순 모델을 실습- AutoML 도구(예: Google AutoML, Azure ML)로 빠른 프로토타이핑
📈 인사이트 도출 및 설득 - 모델 결과를 데이터 시각화 (예: Tableau, PowerBI)- ‘왜 이 기능이 필요하고, 어느 정도 개선될 것인지’ 구체적 수치 제시
🤝 Stakeholder와 협업 강화 - 데이터를 이해하는 언어로 소통- 비즈니스 문제를 데이터로 풀어내어 신뢰 구축
📚 지속 학습 - 머신러닝의 원리 이해 (ex. 모델 과적합 방지, 성능 지표 이해)- 비즈니스/사용자 관점에서 ‘데이터의 의미’를 해석하는 역량 키우기

🌟 3️⃣ PM으로서 머신러닝을 사용하는 이유

✅ 단순 직관이 아니라 정량적 근거로 의사결정

✅ 서비스 개선의 ROI를 수치로 표현 가능

✅ Stakeholder 간 신뢰도 및 설득력 강화

✅ 데이터 기반으로 사용자 경험을 예측 및 최적화


📌 결론

  • PM이라면 머신러닝을 단순한 모델링 도구가 아닌, 비즈니스와 사용자 문제를 푸는 도구로 활용.
  • 단순히 모델을 만들기보다, “이 데이터로 어떤 문제를 풀까?” “이 인사이트를 어떻게 서비스 전략으로 연결할까?” 에 집중하면 PM으로서의 데이터 리더십을 향상가능 .

단계 PM 성장 머신러닝 학습

1️⃣ 기초 이해 - 제품 기획, 사용자 중심 사고, 문제 정의- KPI, 지표 관리 이해 - ML 개념 이해(지도/비지도 학습, 분류/회귀)- Python, SQL 기본
2️⃣ 데이터 분석 활용 - 데이터 기반 의사결정 연습- 간단한 A/B 테스트 기획 및 해석 - Pandas, Scikit-learn 사용- 의사결정나무, 로지스틱 회귀 실습
3️⃣ ML 도입 실습 - 비즈니스 문제와 데이터 연결 시도- 사용자 세그먼트 정의, 페르소나 기반 기획 - AutoML 도구 사용- 사용자 이탈 예측, 사용자 군집화
4️⃣ 설득 및 확장 - 분석 결과를 시각화 및 스토리텔링- Stakeholder 설득 경험 쌓기 - ML 성능 평가 및 개선 이해- Overfitting, 성능지표(F1, AUC 등) 학습
5️⃣ 데이터 리더십 - 데이터 기반 비즈니스 전략 수립- 조직 내 데이터 문화 확산 - ML+비즈니스 문제 해결 프로젝트- ML 모델의 비즈니스 가치 평가
  • 머신러닝 학습1️⃣ 지도학습(Supervised Learning)
    • 주어진 **정답(라벨)**을 기준으로 학습하고, 새로운 데이터에 대해 예측을 수행.
    • 대표 알고리즘:
      • 선형회귀, 로지스틱회귀
      • 의사결정나무, 랜덤 포레스트
      • 서포트 벡터 머신(SVM)
    • 활용 예시: 스팸 메일 분류, 고객 이탈 예측

    2️⃣ 비지도학습(Unsupervised Learning)
    • 정답 없이 데이터 간의 유사성/패턴을 찾아내는 학습.
    • 대표 알고리즘:
      • K-means 클러스터링
      • 주성분 분석(PCA)
      • DBSCAN
    • 활용 예시: 고객 세분화, 이상치 탐지

    3️⃣ 강화학습(Reinforcement Learning)
    • 행동-보상 기반 학습: 환경에서 시도하고, 보상을 최대화하도록 학습.
    • 대표 알고리즘:
      • Q-learning, Deep Q Network(DQN)
      • 정책 경사법(Policy Gradient)
    • 활용 예시: 게임 AI, 로봇 제어, 추천 시스템 최적화

    💡 이 3가지 학습 방식 외에도 머신러닝의 핵심 기술에는:
    • 피처 엔지니어링(Feature Engineering): 데이터를 사람이 이해할 수 있도록 가공.
    • 모델 평가 및 튜닝: 교차 검증, 하이퍼파라미터 최적화 등.
    🌳 의사결정나무(Decision Tree)
    • 데이터를 분할하며 분류 또는 회귀 문제를 해결하는 트리 기반 모델.
    • 데이터의 **특징(Feature)**를 기준으로 **조건문(if-else)**처럼 나누어 트리를 형성.
    • 트리의 **루트(시작)**에서 **리프(끝)**까지 내려가면서 최종 예측 결정.
    • 🌟 장점:
      • 이해하기 쉽고 시각화가 가능.
      • 적은 데이터로도 빠른 학습.
    • ⚠️ 단점:
      • 과적합(overfitting) 가능성 큼.
      • 작은 데이터 변화에 민감.

    🌲 랜덤포레스트(Random Forest)
    • 여러 개의 의사결정나무를 무작위로 생성해 다수결 방식으로 결과를 결정하는 앙상블(Ensemble) 기법.
    • 각 트리는 데이터와 특징을 랜덤하게 선택해 학습.
    • 🌟 장점:
      • 과적합 방지 (다양한 트리를 조합).
      • 안정적이고 예측 성능 우수.
      • 다양한 데이터 타입(숫자, 범주형) 처리 가능.
    • ⚠️ 단점:
      • 단일 트리보다 학습 및 예측 속도 느림.
      • 해석이 복잡해짐.

    🖼️ 간단한 비유
    • 의사결정나무: 하나의 판사(한 명의 트리)가 규칙을 정해 판단.
    • 랜덤포레스트: 여러 명의 판사(여러 트리)가 각각 독립적으로 판단하고, 다수결로 결정.

    💡 한 줄 요약
    • 의사결정나무: 데이터를 if-else 규칙으로 나눠 최종 예측하는 간단한 트리 모델.
    • 랜덤포레스트: 다수의 의사결정나무를 결합해 안정적이고 정확한 예측을 수행하는 모델.
  • 🏗️ 머신러닝의 핵심 기술