Oxygen Cherry - Pencil
본문 바로가기

새싹 데이터 분석 교육 (24.05.13~24.08.16)/TIL

문제정의 하는 날

728x90

[성동2기 전Z전능 데이터 분석가] 0729

 

 

파이널 프로젝트 5일차

❇️ 오늘 한 것 
1. 금요일에 정한 주제에 대해 골몰하기
2. 그동안 수집했던 자료들 정리하기 
3. 도서관 주제를 고민하면서 정리하기 

 

 

 


저번주 금요일에 2차 멘토링을 받고 

주제를 '수도권과 지방의 일자리 격차'로 좁혔었다. 

 

근데 암만 생각해봐도... 정책 기획이나 사업 기획에는 적절한데 

어떻게 서비스 기획으로 풀어야 할지 모르겠는 거다! 

 

그래서 3가지 주제를 놓고 다시 고민했다. 

 

 

| 1. 수도권과 지방의 일자리 격차? 

주제 유지하고, 다른 변수로 하는 방법

장점: 문제를 분석과 기획으로 풀 수 있음, 데이터가 많다, 지방분권 공모전 가능  

단점: 서비스로 풀어내기 어렵다

 

  • 부산-서울 일자리 격차를 어떻게 서비스화할 것인가? 

주제: 서울과 부산 일자리 차이 오지는데, 어떤 변수 차이 때문일까? 흔한 변수 말고 새로운 상관관계를 찾아보자. 

 

 

데이터에 관하여 

  • 데이터량은 많은데, 직접적인 데이터(취업 목적으로 상경한 사람과 아닌 사람의 이런저런 차이)는 잘 없었음.
    • 어떤 특성을 가진 사람이 취업, 진학 목적으로 상경하는가를 다룬 보고서가 있긴 했음.   
  • 간접적인 분석은 가능. 
    • 예를 들어, '부모의 경제적 수준이 높을 수록 진학 목적으로 상경하는 경우가 많다'는 보고서의 결론 →
      독서율과 진학의 상관관계, 부모의 경제적 수준에 따른 성장기 청소년의 독서율 + 비학군지와 학군지 간 경제수준 차이, 부모의 경제 수준에 따른 교육열 차이 → 
      {공공도서관 갯수, 총 장서 수, 입고량 수, 베스트셀러 보유 현황, 아동 도서관 현황, 분야의 다양성} 등에 따른 비학군지와 학군지 간의  차이 
      → 종합 결론(예시) : 부모의 경제적 수준이 높을 수록 비싼 학군지에 사는 경우가 많고, 학군지에는 도서시설이 유독 잘 되어있고, 독서율은 진학에 유리하기 때문에, 공공도서관 시설을 특정 지역에 확대해야 한다. 

    • 다른 가설 예
      • 취업상경족은 4차 산업혁명 이후로 소폭 증가했을 것이다. 
      • 취업상경족은 보수 정권이 집권할 때 증가할 것이다 
      • 창업지원 상황과 취업상경족의 수는 연관관계가 있을 것이다
    • 근데 이러한 가설들은 시기별 취업상경족 데이터가 있어야 가능함. 
      지역별 인구이동 조사는 있지만 목적별로 매년 집계한 건 못찾았다. 
      대체 왜 이런 걸 조사 안하지?! 
      => 찾았음. 저번주 til에 함께 정리했음. 

 

 

문제 

  • 기존에 있는 섹시한 분석들과 안 겹칠 수 있을까? 
    → 데스크 리서치 열심히 하면 됨 
  • 딱 적합한 데이터를 찾을 수 있을까? 
    → 데이터 자체는 많으니 발품 함 팔아보셈. 
  • ⭐⭐⭐ 어떻게 기획으로 뽑을까? ← 제일 문제 
    • 처음 생각은 필요한 결론들을 뽑아서 워크넷 같은 구인 사이트나 지역 구인 서비스에 부가 기능으로 넣으려고 했음. 
    • 그러나? 꼭 구인 서비스에 매몰될 필요는 없는 거 같음. 
      도서관 갯수가 문제였다 치면 전국 통합 도서관 서비스 만들면서,.. 하면 되지. 

하 근데 선명히 모르겠음. 

 

 

 

 

| 2. 도서관 주제로 할까? 

아예 새로운 주제로 하기 

장점: 문제를 분석과 기획으로 풀 수 있음, 도서관 공모전 참여, 데이터 많음, [인터렉티브 도서(가칭, 전자책 뷰어)] 아이디어와 연결 가능, 수상해보이지 않는 주제

단점: why가 약함, 두루뭉술

 

 

  • 들어갈만한 기능들  

 

  1. 내가 가입된 도서관 지도 시각화로 보기 
    1. 도서관별 이용현황
    2. 내 거주지, 출장지, 본가 , 모교 등 표시 
  2. 어른용 꿀잼 독서 장치
    1. 퀴즈나...
    2. 업적/칭호 시스템 
      1. 전자책 읽는 법: 형광펜 죽죽러 / 책갈피 / 깨끗하게 읽는 편 
      2. 시간: 꽂힐 때 읽어 / 심야 독서러 
      3. 분야: 분야보단 키워드! / 이야기 수집가 / ㅇㅇ작가님 팬 
    3. AR 증강현실 문장 수집 
      1. 내가 하이라이트 한 문장 
      2. 내가 문장 공유에서 담은 것 
      3. 내가 찜해놓고 읽지 않는 책들 
  3. 지역별 도서관 경쟁 
  4. 희망도서 신청 
    1. 베스트셀러인데 우리 도서관엔 없어요!
    2. 나도 보고 싶어요!
    3. 도서관별 도서구입 사업 예산으로 표를. 
  5. 전자책 위주인가 오프라인도 포함인가? 
  6. 도서관 데이터를 활용해서 뭘 얻으려고 하는가? 

 

 

 

  • 도서관 서비스

 

ㄱ. 독서로 

https://read365.edunet.net/ 

아놔 어른도 이런 거 해줘~~!

 

비슷하게 아동용 독서교육 서비스로 읽걷쓰라는 게 있음. 

 

 

 

ㄴ. 국민도서관 책꽂이 

https://www.bookoob.co.kr/

2011년 시작된 세계 최초의 공유도서관인 국민도서관 책꽂이는 책주인이 공유를 전제로 책을 보관하고, 다른 많은 사람들이 모인 책들을 무료로 빌려읽을 수 있도록 도와주는 온라인 도서공유 플랫폼입니다. 

 

 

 

ㄷ. 북코스모스 

https://m.bookcosmos.com/user/service_intu.asp 

도서요약본 서비스 

 

 

 

ㄹ. 두드림 (개발 중)

https://www.etnews.com/20230510000118

두드림시스템은 지역 내 모든 도서관을 통합 관리할 수 있는 클라우드 네이티브, 마이크로서비스아키텍처(MSA)를 적용한 SaaS 서비스 도입으로 지역 주민들에게 혁신적인 서비스를 제공하고 있다. 또 이를 기반으로 도서관 서비스를 한 단계 업그레이드 한다는 계획이다.

이를 통해 분산된 이용자 데이터 및 도서 데이터를 통합하고 대량의 데이터 분석을 가능하도록 만들어 지역 주민 요구에 부합하는 맞춤형 서비스를 제공한다는 계획이다.

 

 

 

  • 경쟁 서비스 
  • 문해력 
  • 전자책 대여/구매 플랫폼 + 웹소설도 파는 곳 포함 
  • 독서 관련 서비스들 

 

 

 

  • 데이터 수집하는 곳 
    1. 도서관 정보나루 
    2. 문화 빅데이터 플랫폼  
    3. 사서의사결정지원서비스 솔로몬 ← 일반인 이용 불가 
    4. R 기반 빅데이터 분석 툴 Radar ← pc로 다운받아야 함. R 필요  
    5. 국가도서관통계시스템  

 

 

  • 공모전 정보 

https://data4library.kr/noticeV?cn=201 

 

공지사항 - 도서관 정보나루

안녕하세요. 국립중앙도서관에서는 도서관 데이터에 대한 대국민 관심과 참여 유도를 위해 「2024 도서관 데이터 활용 공모전」을 다음과 같이 실시하고자 합니다. = 다     음 =  ◎ 공모전명 :

data4library.kr

 

 

 

| 3. 의정활동 다이어리 

예전부터 구상해둔 집단지성 시리즈 만들기.

장점: 궁극적인 why 확보 

단점: 분석으로 문제를 해결하지 않음. 

 

 

  • 저번주 금요일에 써둔 주제 정리 



 

데이터 수집처 & 국회감시 관련 사이트 

 

 

공공데이터포털에 법률 체크하고 의회 검색하기. 

 

 

ㄱ. 더 좋은 정치 

http://thepola.kr/ 

 

더좋은정치

국회의원 의정활동 성과평가 결과 자료 및 정보 제공

thepola.kr

국회의원 평가하는 단체 

 

 

ㄴ. 오픈와치 

https://www.openwatch.kr/ 

 

오픈와치 | 권력에 대한 정보를 공개하고 권력을 감시합니다.

국회의원, 지방의원 등 공직자 및 정치인의 재산, 학력 등 프로필, 활동 내역 등을 알려드립니다.

www.openwatch.kr

투명사회를 위한 정보공개센터가 제공하는 곳으로 각종 데이터 정보를 받을 수 있음. 

 

 

ㄷ. 열려라 국회 

https://watch.peoplepower21.org/home#watch 

 

열려라국회 - 참여연대 국회감시전문사이트

열려라국회, 총선, 대선, 대통령선거, 후보자, 참여연대,권력감시,시민단체,시민정치,제도개선,유권자운동,표현의자유

watch.peoplepower21.org

참여연대 의정감시센터가 만들어 운영하는 국회의원 DB사이트 

 

 

ㄹ. 제9기 광역시의원 입법 데이터 확인하기https://han.gl/zjkqZf 

 

 

ㅁ. 2022년 지방선거 1주년을 맞아, 전체 243개 광역 및 기초의회 현역 의원의 프로필을 모은 ‘2023 전국 지방의원 상세이력 데이터’를 공개

2023 전국 지방의원 상세이력 데이터 (클릭) 

 

ㅂ. 열린국회정보 OPEN API 

https://open.assembly.go.kr/portal/bbs/guide/searchBulletinPage.do 

 

 

 

 

 

  • 읽어보면 좋을 자료들! 

 

https://www.peoplepower21.org/magazine/1571832

 

[특집] 우리동네 국회의원 감시하는 방법 - 참여연대 -

특집1_이게 국회냐!  우리동네 국회의원 감시하는 방법 글. 박대용 뉴스타파 기자     6.13 지방선거가 끝난 뒤, 자유한국당 국회의원들이 무릎을 꿇고 […]

www.peoplepower21.org

 

 

국회의원 수 적절할까 

https://newneek.co/@pizzastation/article/7932

 

🔔띵동! ‘국회의원 정수’ 피자가 도착했습니다!

“그 이슈, 다른 사람들은 어떻게 생각할까?” 피자스테이션에 오신 것을 환영합니다! 🍕 뉴닉이 준비한 따끈따끈 이슈 도우에 뉴니커가 얹은 다채로운 의견 토핑을 맛봐요. 한 판 뚝딱 해치우

newneek.co

 

 

http://thepola.kr/bbs/content.php?co_id=jang

 

더좋은정치

국회의원 의정활동 성과평가 결과 자료 및 정보 제공

thepola.kr

 

 

https://www.youtube.com/watch?v=AUOjyCRgqr4

지방의원 전격분석 4부작 (2023) 

https://cfoi.or.kr/5137

 

 

여기에 어떤 내용들이 있는지 참고 

https://watch.peoplepower21.org/?mid=Member&member_seq=1270#watch 

 

- 열려라국회

열려라국회, 총선, 대선, 대통령선거, 후보자, 참여연대,권력감시,시민단체,시민정치,제도개선,유권자운동,표현의자유

watch.peoplepower21.org

 

 

 

 

  • 의정활동 다이어리에 어떤 기능을 넣고, 어떻게 차별화 시킬까? 

의정활동 다이어리에 들어갈 내용은 ..

홈 : 관련 정보들, 태그들 (발로 뛰는) , 관심사 등

방명록, 일기와 지표 대시보드

빠지거나 지각하면 이유 써야 함

시민과 소통할 수 있는 창구…

 

 

아 근데 열려라 국회 찾아버려서 조금 더 난감해짐 ;; 

ㅠ.ㅠ

물론 내 구상과는 차이점이 있지만 

 

1. 어떻게 의원이 쓰게 만들까? 

2. 어떤 걸 분석해서 차별화할까? 

3. 어떻게 문제를 해결하는 서비스로 구축할까? 

4. 데이터를 어떻게 하면 더 잘 활용할 수 있을까? 소통안하는 의원과 하는 의원의 차이? 

고민쓰 

 


 

왜 주제를 이토록 고민했는가 & 결론 

 

1번 서울-부산 일자리는 문제로부터 출발한 거기 때문에 

문제를 분석해서 기획까지 도달한 경험 퍼펙트. 

그러나 어떻게 서비스 기획까지 할지 연관성이 불투명해 보인다. 

아님 차라리 독서율, 일자리, 지방격차 3가지 키워드로 해서 도서관 데이터와 연합했으면 어딸까? 

그래서 온오프라인 지역 독서 관련 서비스 만드는 거... 

 

 

2번은 도메인 활용이 유용해보임. 

 

3번은 분석으로 문제 해결을 할 방향성을 찾아내어 기획하는 게 아니고 

기획이랑 분석이 따로야.... 

그래도 돼?! 

분석으로 문제 해결하는 메리트를 날리는데??!? 

 

멘토님이, 

1번 주제 어떻게 서비스 기획으로 풀지 지금 결론 내리려고 하면서 안된다고 걱정할 필요 없다고 

나중에 상관관계 흐릿한 기획을 하게 되어도 그걸 어떻게 스토리텔링 할지가 기획자 역량이라고 하셨지만 

1번 주제도 나름 할만 하겠지 근데? 

하려면 좀더 구체적이고 세부적인 변수를 설정해야 할 거 같고... 

분석만 한다면 1번도 걍 괜찮지만... 

 

기획까지 하는 것의 난이도를 생각해봤을 때 3번으로 변경하기로 결정함. 

원래 생각하던 집단지성 시리즈 하나를 드디어 하는 거기도 하고. 

 

근데 또 열려라 국회 찾아내니까 또 고민 가동됨. 

허허. 

 

근데 또 그래도 뭐라도 나올 건 좀 있으니까... 어... 

 

 

  • 멘토님 의견 
  1. 데이터 분석만 할 수 있다면 사실 어떤 주제는 상관없다. 서비스 기획 하려는 사람들에게는 거기까지 해보라고 권장할 뿐. = 데이터분석만 하게 되어도 되긴 함 
  2.  정석적인 건 아무래도 문제 정의 - 데이터 분석 - 인사이트 도출 - 서비스 기획, 즉 기획의 근거를 분석으로 준비하는 것 = 기왕이면 분석한 걸로 기획을 해라 
  3. 그래도 의정활동 다이어리 방식으로 못할 건 없다...! = 분석과 기획이 같은 주제긴 한데 따로 놀아도 되긴 하다...  
  4. 자꾸 부산-서울 일자리 관련해서 기획 안될 거 같다고 미리 걱정하는데 일단 가설 실패하더라도 해보는데 의의 있는 것이다. 어차피 학생들 수준에 큰 기대는 없고... 뭐든 해봐야 결과를 아는 거고... 가설 실패해도 실패했다는 의의가 있는 거고... 
  5. (높은 상관관계가 있는 변수는 정책으로 풀어야 해서) 낮은 상관관계로 기획을 하면 폿폴의 매력도가 떨어지지 않겠냐고? 그걸 짜맞추는 게 기획자의 역량이다. 
    (만약에 일자리 이동에 가장 큰 영향을 끼치는 변수들이 인프라, 부모의 학력, 산업 집중도라고 하자. 이건 기획으로 풀기보단 정책으로 풀어야 한다. 그래서 그 다음 영향을 끼치는 독서율이란 변수를 찾았는데, 상관관계가 그렇게 높진 않다. 그래서 일자리 격차 문제를 풀기 위해 독서 관련 서비스를 만들었다고 하기엔 상관성이 떨어지는 것이다. 지금 데이터 딱 보기만 해도 큰 영향을 끼치는 것들은 정책 관련 같은데, 이런 경우는?!)   

 

 

 

 

 

더 찾아볼 정보들
예~전 직장에 연락  의정활동 다이어리 등 그 지역 의원들 힌트 달라고 하기 
  소통하는 국회의원 VS 아닌 국회의원 관련 데이터 찾을 수 있을까?
참여연대 등 메일 보내기 
  국회의원 특권 추이를 살펴보고 감시 필요성을... 
  기초의원이 지역민의 목소리에 더 귀기울여야 하는 이유 
  개인 소통 창구를 갖고 있는 의원들 목록과 그 소통 창구 접근성, 용도 등 

 

 

 

 


 

여담

 

No 설치, No 코딩! 크롬과 엑셀만 있으면 10초면 가능한 웹 크롤링 자동화까지 | 정말 편리합니다! 

https://www.youtube.com/watch?v=SYQMKXs8x48

 

J.O님이 공유해주신 프로그램 깔아서 크롤링하는 방법

탱큐베리망치인 부분 

 

 

 

 

좋아하는 플리 설문조사에 참여한 거 

 

술탄 오브 디스코 - 사라지는 꿈 
술탄 오브 디스코 - 통배권 
뷰렛 - 웃지 않는 공주 
송가인 - 서울의 달 
쏜애플 - 서울 
넬 - 기생충
못 - 나의 절망을 바라는 당신에게 
투어스 - 첫 만남은 너무 어렵데이 
데미 로바토 - cool for the summer 
달샤벳 - 미스터 뱅뱅 
비비지 - maniac 
아이들 - 내는 아픈 건 딱 질색이라카이 
안예은 - 쥐
심규선 - 꽃처럼 한 철만 사랑해줄겁니꺼... 
심수봉 - 개여울  
하도권(위시ost) - 감히 내를 배신했나 
세븐틴 - 아주 나이스 
b.a.p - zero 
찰리ost - sweet tooth 
올리버 트리 - life goes on 
비와이 - 셀러브레이션 
fleur east - sax 
the 1975 - robbers 
트와이스 - 톡 댓 톡 
서도밴드 - 뱃노래 
제시 - zoom 
정우 - 내일도 내를 사랑해주실 겁니꺼... 
정우 - 나에게서 당신에게 
최삼 - 꽃뱀 
아이유 - 이지금 
호두까기 행진곡 
공주는 잠 못 이루고 
김수희 - 화등 
박인자 - 댕구지 아리랑 
tempalay - doooshiyoooo!!
나루토ost - 결의
보현스님 - 가야지 
김소현 - 황금별 (뮤지컬) 

등 다수의 잡다한 곡.....


 

[회고]

 

오늘 저녁은 b.r님, j.o님이랑 김밥 두줄 노나먹었다. 

압구정김밥의 참치김밥... 

BR님이 하는 스터디에서 남은 돈으로 싸온 것이다. 

 

갑자기 내 책상에 김밥 얹으시길래 ?? 하고 있었는데 

결론적으로 나는 좋았다. ㅎㅎ 헤헤헤헤헤

 

 

예전 회사 대표님은 나의 어떤 포인트들로 인해 날 싫어하셨는데 

물론 장점도 봐주셨긴 했지만 결론적으로는... 

그런데 이 분들은 날 포용해주셔서 다행이라 생각한다. 

 

물론 내가... 사람이 좋아야 수용 가능한... 

(장점도 눈에 띄긴 하는데 그런만큼) 어떤 부분은 정말 꽝인 사람이라는 게 속쓰리지만.... ㅠ 

어쩌겠는가. 나는 늘 나의 이런저런 면들을 고치기 위해 고민해왔다. 스스로는 모를 뿐. 

늘 내가 내세워야 하는 전략에 대해 골몰했다. 왜냐면 누구랑도 무난하게 잘 지내고 싶기 때문... 

 

 

 

 

그런 점에서, 조언을 듣고 하나 알게 되었다. 

공적인 자리에서 하는 질문과 

따로 찾아가서 할 질문을 구분할 것! 

 

예를 들어 

- 리뷰 분석 어떻게 할 거냐~ 이런 질문은 해도 돼. 

근데 이제 참고한 블로그 링크 나도 달라는 얘기는... 나중에 따로 해!

 

그리고 

- 노션에서 저런 효과 어떻게 내셨냐 

이런 질문은 주제랑 약간 어긋나니까 따로 해! 

 

물론 호기심많고 여러가지 알려고 하는 점은 좋은 거고 

그러다 성공할 수도 있는 거지만 

내 딴에는 많은 정보가 유통될수록 서로 많이 알아가는 거니까 누이좋고 매부좋고 시어머니 좋고 며느리 좋고 너도 좋고 나도 좋은 일이라고 생각해서 그런 거지만 

핵심은 ... 공적 질문과 사적 질문을 구분할 것!! 

 

--

 

아니 근데 지금 

아니 나 7시 4~50분 정도까지 남아서 하다가 

동생 있는 PC방에 9시 12분? 쯤 도착해서 12시 8분인 지금 이 글을 마무리하는데 

내가 이 TIL만 집중해서 한 건 아니라지마는 

그래도 꽤 몰두했는데 지금 끝난 거 실화냐 짜증난다; 

배보다 배꼽이 더 크다... 

내용이 중요하지 서식 정리하는 거 귀찮다... 

 

 


#청년취업사관학교 #데이터분석가 #데이터분석가부트캠프 #DA교육 #데이터분석교육 #실무프로젝트 #실무경험 #취업포트폴리오 #포트폴리오 #취업연계교육 #코멘토 #모비니티 

728x90