기초 통계지식 학습 2일차
❇️ 오늘 배운 내용
1. 스타트업의 특징, 애자일이란
2. 데이터 분석 기초 개념
3. 현업 선배들과의 만남
4. 설문조사 실습 + 그룹과 공유해서 서로 피드백
주요 개념
애자일, PMF, 데이터 클리닝, ETL, 데이터 파이퍼라인, 스펙(명세서), 시각화, SQL, 대시보드
오전 강의
면접 볼 때는 일반인이 구할 수 있는 가비지 데이터를 가지고 어떻게 자기만의 문제정의를 했는지가 중요하니까
이번주에 할 개인 스프린트 잘해보도록.
| 스타트업이란?
- 스타트업 특징: 빠르게 진행하는, 도전적인, 책임과 비전, 개인의 성장 중시 → 애자일 방법론으로 일함
- 애자일: 빈번하게 소통하면서 고객 중심으로 빨리 쳐내는 업무 방법론. IT 스타트업이 좋아함.
스타트업 특징
- 왜 저게 중요할까?
빨리 안하면 금방 망하기 때문에...
고객이 중요하게 여기는 걸 서둘러 쳐내야 하기 때문에...
수평적 조직문화
- 직급과 나이에 얽매이지 않는 호칭, 닉네임, 누구님 (대표 포함)
- 토론 활발
- 협업, 팀워크
- 서로의 아이디어를 존중
높은 자율성, 책임감
- 업무 시간과 장소를 유연하게
- 맡은 일을 스스로 판단해서 추진할 수 있게 최대한 권한을 줌
- 자연히 오너 중요해짐
- 실패하더라도 그 이유를 탄탄히 알아서 분석하고 다음 플젝 잘해야 됨
성장 중심의 사고방식
- 끊임없이 성장하려는 태도
- 개인의 성장 = 조직의 성장
- 고객의 피드백에 빠르게 대응
- 변화와 새로운 것을 받아들인다 (토스 휴대폰 송금 처음엔 못믿을 일
[중간 질문]
실패에 대한 커다란 리스크
- (저연차 포함) 개개인에 대해 권한을 많이 줌
- 실패를 두려워 하지 않고 시도해봄 (디자인 스프린트)
이 특성과 어떻게 함께 갈 수 있는 건지?
보통 스타트업은 정부 사업으로 돈을 받음
그래서 빨리 PMF를 빨리 찾아서 검증해야 됨 빨리 찾으면 그리 큰 리스크는 아님
약간 지원받고 도박하는 거.
직원에게 권한을 얼마나 줄지는 대표의 선택이고 어떻게 운영할지도 대표의 역량
저연차 권한도 마냥 주는 게 아니라 데일리 스크럼을 해서 아이디어 같은 거 일단 들어보고 조언해주고 그러는 거임. 팀워크와 소통 ㅇㅇ
연차에 맞는 권한만 주는데 그 연차에서도 최대한 준다는 거임.
만약 데일리 스크럼 같은 장치가 없고 새로운 거 시도만 하는 스타트업들은 망하는거....
—
스타트업에 없는 3가지
돈, 시간, 인력
돈이 없으니까 인건비 벌려면 빡세게 일해야 하고,
그러다 보니 시간이 넉넉치 않고,
돈이 없으니 인력을 많이 쓸 수 없어서
그럼에도 스타트업에서 일하는 이유?
비전있는 팀과 일할 수 있고, 하고 싶은 일과 새로운 것을 하면서 집중 성장 가능.
처음 시작으로는 초기 스타트업은 추천안함.
데이터 분석 관련한 일을 많이 못하므로.
전공자, 관련 여러 프로젝트를 했으면 적응 쉽겠으나
시스템이 부재하니까 그걸 본인이 처음부터 만들어야 됨.
EX. 코드리뷰 문, 체계적인 휴가 사용 규칙, 근태관리를 위한 툴 뭐 쓸지
신입들은 시스템과 문화가 있는 쪽으로 가서 배우자~~!
- 시스템이 있는지는 어떻게 알아볼 수 있을까요?
개발 블로그가 있는 회사.
(필수 조건X)
EX. 배민 기술 블로그
애자일
워터폴 방식의 단점
- 시장 변화에 대응이 느리다.
- 유지보수 비용이 높고
- 긴 호흡으로 가져갈 수 있는 고능력 인력들 폴이 원체 적다.
애자일 핵심
MVP 빨리 보여주고 피드백 받고 개선하는 루프를 돌림.
급변하는 시장에 대응하는 전략
→ 애자일은 워터폴의 단점을 개선해서 빠른 시장 환경에 대응하기 위한 업무 방법론.
애자일 원칙과 핵심
동기가 부여된 개인들에게 필요한 환경을 제공하고, 믿고 맡김.
정보를 전할 때는 얼굴을 마주보고 대화.
애자일 매니페스토
- 계획보다 변화
- 딱딱한 문서나 도구에 의존하기 보단 실제 상호작용
- 개발 막바지여도 고객이 원하면 바꿔준다
- 전달 주기 짧게 해서 조금씩 자주 업데이트 한다
- 비즈니스 담당자들은 개발자와 소통을 빈번하게 한다
애자일에서 파생된 대표 방법론
- 익스트림프로그래밍
2주 반복 개발, 테스트 우선 - 스크럼
30일 스프린트
애자일 도구
- 대표적인 애자일 프로젝트 관리 툴, 지라
- 구글에서 사용하는 성과 측정 툴 OKR
그 외 애자일 관련 용어
- DUE DATE 마감기간
- ASAP 최대한 빨리 해줘
- FIT
- ASSIGN: 어사인. 작업을 담당자에게 할당한다. 업무 툴 쓸 때
- 아젠다: 주제 논의사항
- BM: 수익모델 많은 스타텁들이 BM이 부실해서 정부과제 떨어지고
- API: 애플리케이션 프로그래밍 인터페이스. 뭐를 하면 뭐를 돌려준다는 규약
- 마일스톤: 프로젝트의 이정표가 되는 사건들, 달성 시점을 표시
- 온보딩: 신규 고객과 직원을 우리 서비스와 조직에 적응 시키는 것
- TFT: 테스크 포스 팀. 특정 과제를 한시적으로 처리하기 위해 구성된 팀. 긴급
- AS IS / TO BE: 현재, 앞으로 바뀔 미래. 발표자료에 잘 들어가는 것
- 도메인: 어떤 전문분야, 인터넷 주소
- 아이데이션: 아이디어를 뽑자 브레인스토밍 하자는 의미로 쓰임.
| 데이터 분석 기초 개념
데이터 클리닝, ETL, 데이터 파이퍼라인, 스펙(명세서), 시각화, SQL, 대시보드
데이터 분석 과정 중의 80%는 데이터 클리닝 하는데에 쓰이고
나머지 20%는 그걸 불평하는데 쓰인다.
ETL은 데이터 엔지니어가 함.
이걸 데이터 엔지니어랑 분석가가 같이 함.
직접 할 수도 있고 대시보드에 뜨게끔 할 수도 있는....
SQL : 데이터베이스에서 데이터를 검색하고 조작하는 언어로, CRUD를 쓸 수 있다.
CRUD: 크리에이트 리드 업데이트 딜리트
NOSQL: 비관계형 데이터베이스. 대규모 데이터 처리를 위한 데이터 저장소.
SQL를 안쓰는 그런 건 아님!
데이터 비주얼리제이션(시각화): 이해할 수 있게 시각적으로 표현하는 것. 텍스트로 나열하는 것 말고 차트로 만드는 식.
회사에선 간단하게 스펙이라고 함.
데이터 스펙 주세요~
데이터 스펙 예시 양식
데이터 대시보드 예시
머신 러닝: 데이터를 이용해서 모델을 학습시키고, 다음 데이터를 예측하게 하는 기술
딥 러닝: 석사 수준의 전문 기술로, 인공 신경망(사람이 생각하는 뉴런을 따라한 기술)을 기반으로 하는 기계 학습
—
[툴 추천]
노션 쓰는게 지라보다 돈 절약되어서 쓴다고 함.
미로 추천해주심.
오후 강의
| 고객 인터뷰 하는 법, 선배와의 만남
요약 생략
- 고객 인터뷰를 잘하는 법
어떻게 하면 ~를 할 수 있을까 HMW
설문 하는 사람은 이게 뭘 하는 거지 라는 느낌을...
ㅠㅠㅠ
강의자료 올라오면 보충해야지!
- 멘토님께 내가 따로 드린 질문 : 문항 작성 및 주제 선정의 어려움에 대하여
- 주제가 넘 넓어서 감이 안잡히는 걸 수도 있으니 주제를 좁혀라.
친구랑 노는 방법에서 → 연락 빈도 / 정산 / 노는 형태 등 - 어떤 내용들로 보기를 넣어야 할지 모르니까, 주관식 질문으로 구성한 사전 조사를 주변에 일단 먼저 돌려라.
답변 참고해서 본 설문 문항을 만들면 됨.
실습
각자 구글폼으로 질문지를 만들고 나면, 4시 30분부터 스터디그룹 시간이 시작된다.
스터디 그룹은 이번주 한정으로 구성된 4~5명 모임으로 각자 소회의실에 들어간다.
그렇게 우리는 각자의 설문지를 공유하고, 설문을 제출하고, 피드백을 나누었다.
답변 샘플은 각자 3개씩 가지게 되었다.
나는...... 주제 같은 걸 제대로 준비를 못해서...
급하게 짠 거를 갖다가..
그래서 암튼 주관식으로 아무튼 형편없는 설문지를 늦게 주었다.
BUT!!!!!
스터디원분들 피드백은 엄청 열심히 주었다!!! ^_^
그건 잘했어!
- 내가 선정한 주제
화요일에 어렴풋하게 생각하고 있던 주제:
1. 지방의회 정치인 출석율 조사
→ 모수 모으기 어려울 것 같다 생각.
2. 언론 패턴 찾기
→ 설문으로 가능한게 아닌 거 같음.
생각한 주제:
1. 직장 환경에 따른 선호도, 적응도 차이 및 적응 여부에 따른 불편함 사례
2. 친구 사이에 노는 방법이 다 다른...
- 스터디그룹 주제 및 하이호가 드린 피드백
A님
- 야구 하위구단의 역전 가능성을 예측해주는 서비스
- 문항마다 기타라는 선택지가 있으면 좋겠다고 생각했다.
B님
- 직장인 여가 활동 조사
- 근무 요일 선택에서, 일하는 요일 7일 중 다중선택으로 되어있었다.
- 대부분은 평일 5일 근무일 것인데 매 사용자가 5일 내내 체크하는 게 불편할 수 있고, 실수할 가능성도 높다.
→ 평일 근무라는 선택지를 만들어주면 좋겠다. - 대체로 평일 근무하지만 주말에 출근하는 경우가 많은 경우는 어떻게 투표해야 하는가.
- 교대근무해서 매번 일정이 변동될 가능성 있는 분들을 위한 선택지가 없다.
- 일용직 근로자, 프리랜서는?
- 따라서 보기를 [평일 근무/평일이지만 주말에도 출근 다수/ 교대 근무라 유동적/특정 요일에만 근무 → 꼬리질문으로 요일 선택/기타...] 같은 식으로 변경하는 것도 고려할만 하다.
- 대부분은 평일 5일 근무일 것인데 매 사용자가 5일 내내 체크하는 게 불편할 수 있고, 실수할 가능성도 높다.
- 근무시간을 선택하는 보기에서, 주 52시간 주 48시간 이렇게 되어있는데 자기 근로계약서에 어떻게 되어있는지(특히 통상적인 나이트식스 직장인이 아닌 사람, 알바 등) 모를 수 있으니 부가 설명 해주면 좋겠다.
→ 예시. 주 52시간 (평일 5일 출근 및 하루 9시간 근무) - 여가와 여가 아닌 것을 명확히 구분해주면 좋겠다.
퇴근 후 여가를 즐기시나요? 라는 처음 질문에 아니요라고 답변하면 여가 외에 무슨 활동을 하는지 입력하는 주관식 질문이 바로 나온 다음 설문이 끝난다.
여가를 즐긴다고 답하면 즐기는 여가의 종류가 무엇인지, 어떤 경로로 정보를 수집하는지 질문이 나온다.
- 여가 예시로 공부와 취침이 있었다.
부업, 자격증 공부, 바로 취침 등을 하는 경우 여가를 즐기지 않는다를 선택할 것 같은데....
→ 여가에 해당하는 공부와 여가 외 활동인 공부를 구분한 다음 질문에서 설명해줘야 할듯. 취침도 마찬가지.
(예: 자기계발 목적의 취미 공부는 여가, 커리어 향상 또는 이직 목적의 공부는 비여가 등) - 몇몇 여가활동, 예를 들어 창작 활동, 인터넷 서핑, 인방 숏츠 감상 같은 경우 정보를 어디서 얻는지에 대한 질문에 답하기 애매하다.
친구들과 놀러가거나, OTT를 시청하는 여가의 경우 즐길 콘텐츠 정보를 계속 찾아봐야 하지만
정보를 계속 찾을 필요가 없는 여가도 있다.
→ 경로에 대한 꼬리질문은 2가지로 세분화할 필요가 있다. 정보를 계속 얻어야 하는 여가 / 한번 얻으면 비교적 쭉 이어가는 여가
(또는 어떤 정보를 얻는 걸 말하는건지...?)
- 여가 예시로 공부와 취침이 있었다.
C님
- 맥도날드 앱이 분산되어 있어서 사용하기 불편하다는 점을 조사
- 기타 옵션 등 선택지를 더 추가했으면 좋겠다.
- 나의 경우와 설문이 조사하는 유저 결이 다르다.
- 내 경우는 동생이 좋아해서, 동생과 같이 있을 때 자주 시키는 편이다. 동생과 같이 있는 시기엔 자주 시키지만 아닌 시기에는 애매하다. 그래서 빈도를 추정하기 어렵다.
- 자기가 시키는 빈도를 잘 모르겠는 경우
- 또 맥 딜리버리 웹을 이용해서 주문했었다. 허나 이런 사람은 선택지에 없다.
- 보기에 딜리버리 웹/앱이라고 표기하거나
- 초장부터 웹 쓰는 사람은 설문 대상이 아니라고 안내하거나
- 웹 쓴다고 선택한 사람 대상으로 어디가 편해서 쓰는지, 앱은 안쓰는지 등을 질문하는 걸로 해야 함.
- 내 경우는 동생이 좋아해서, 동생과 같이 있을 때 자주 시키는 편이다. 동생과 같이 있는 시기엔 자주 시키지만 아닌 시기에는 애매하다. 그래서 빈도를 추정하기 어렵다.
현업 데이터 분석가 선배와의 만남
- 질의응답
지금까지 오신 멘토님들 보시면 대부분 이과전공이시고, 머신러닝이나 데이터에 대해 석석사까 공부하신 것 같은데요. 비전공자도 데이터 분석에 가망이 있을까요? 혹시 지금 일하고 계신 데이터 부서에도 비전공자(석사가 없는 문과 출신)이 있는지 궁금합니다.
비전공자도 할 수 있음.
it 업계 자체가 이런 거 안보는 영역.
교육을 받으면서 문제정의 부분에서 많은 어려움을 겪고, 쏘카에서도 문제정의 역량을 중요시 여기고 있는데 문제정의 역량을 키울 수 있는 방법이 있을까요?
사고력, 논리력 훈련으로 쌓아지는 역량인 것 같다. 반복훈련을 한다고 생각하고 접근하면 좋겠다.
어떻게 훈련함?
내가 주장하는 바를 잘 전달한다.
ex. 오늘의 집에 선물하기 기능을 넣으면 신규 유저를 늘릴 수 있을 거야!
그것의 근거는?!
오늘의집에서 거래되는 비싼 가구들이 카톡 선물하기에도 거래되나? 만약 안되는 거면 오늘의집에 넣는다고 해도...
수많은 반론이 존재할텐데 그걸 하나하나 찾아서 논리를 세워보는 훈련. 이게 문제해결능력을 키우는 유일한 길일 것이다.
데이터 초기 구축 단계에서 개인적으로 가장 중요하게 생각하시는 건 어떤건가요? 단순히 어떠한 항목들을 얘기해주셔도 좋고 아니면 개인적인 철학을 얘기해주셔도 좋습니다.
근거를 찾기 위해 데이터를 수집한다. 그 데이터는 측정 가능해야 한다.
내가 구할 수 있는 데이터의 범위를 고려해야 함. 대체할 수 있는 데이터는 없는지.
예를 들어 리복 판매량 추정하기 위해 해외 판매량 추이는 못구해도 한국 거는 어째저째 할 수 있으니까.
PM역할을 수행하면서 안맞는 팀원과 일할 때 어떻게 내가 원하는 방향으로 프로젝트를 이끌고 가는지, 반대하는 의견에 대해 어떻게 설득하는지, 끝없이 나오는 의견들을 어떻게 조율하고 그 과정에서 생길 수 있는 딜레이를 어떻게 방지하는지 궁금합니다.
pm마다 성향과 방법이 다른데, 강사님의 경우는
안맞는 팀원과 일할 때 데이터로 증명. 만약 그래도 안되면, 상대 말대로 빠르게 해주고 빠르게 망해서 안되는 걸 증명.
좋은 분위기에서 의견 개진이 잘 된다 생각하기 때문에 둘러둘러 가더라도 조화를 중시.
주로 최종적인 의사결정을 어떤 기준으로 하는지, 실제로 데이터 분석을 통해서 의사결정을 지원하는 비중이 얼마정도인지 궁급합니다.
디렉터가 하자고 하면 해야 됨....
하나하나 데이터로 따지면 오히려 비효율적이니까, 기본적으로 설득을 위한 도구인 거고, 없어도 권위나 만장일치 등으로 의견합일이 되면 꼭 데이터를 통해 의사결정할 필요 없음.
데이터로 의사결정해야만 하는 경우도 있음. 시간대, 수요에 따라 차량 가격이 달라지는 경우. 변동되는 가격 정책을 짤 때.
AI가 데이터분석가 일을 대체할 수 있을거라 생각하세요? (데이터분석가 전망)
대체보단 활용을 많이 할듯. 10명이 하던 걸 1명이 하게 될 수도.
실제 회사 업무가 완전히 대체를 못함.
여담
이전에 썼던 잔디, 카카오워크 등의 툴은 왜 계속 안쓰셨나요? 눈에 띄는 불편함이 있었을까요? 회사 특성과 달라서였다면 어떤 점이 그랬을까요?
(예전에 협업툴에 좀 관심 있었던 적 있어서 여쭤봅니다,,)
저희가 원하는 기능이 잔디, 카카오워크에 없었어요!
webhook 이라던가, 이런저런 연동(notion, drive 연동) 같은 기능들이 없어서
결국에 IT 회사라면 slack을 써야하지! 라는 느낌으로 선태갛게 되었습니다.
파일전송이 쉽고(잔디 500메가 제한) 연동이 편해서 슬랙을 씀.
[회고]
실습 방법을 더 열심히 들었어야 하는데......
주제도 늦게 정하고....
제대로 구상도 안하고...
피곤하다면서 저녁에 자습도 안하고...
그것도 안쓴듯
주제 정리...ㅠ
할 건 많은데 진도는 못따라가서
조급하다 하
그리고 내가 열심히 강조 표시했는데 왜 블로그에는 안보이는 거임?
스킨 코드 어덯게 고쳐야 하는 거냐 번거롭네 지챠
#청년취업사관학교 #데이터분석가 #데이터분석가부트캠프 #DA교육 #데이터분석교육 #실무프로젝트 #실무경험 #취업포트폴리오 #포트폴리오 #취업연계교육 #코멘토 #모비니티
'새싹 데이터 분석 교육 (24.05.13~24.08.16) > TIL' 카테고리의 다른 글
[성동2기 전Z전능 데이터 분석가] 0603 (1) | 2024.06.03 |
---|---|
[성동2기 전Z전능 데이터 분석가] 0530 (1) | 2024.05.31 |
[성동2기 전Z전능 데이터 분석가] 0524 (0) | 2024.05.24 |
[성동2기 전Z전능 데이터 분석가] 0522 (1) | 2024.05.22 |
[성동2기 전Z전능 데이터 분석가] 0517 (0) | 2024.05.17 |