본문 바로가기
[프로젝트 후기]

[프로젝트 후기] SeoulPOT : 서울시 공간(음식점/카페) 분석 웹서비스

by seom-j 2025. 1. 22.

 

📌 프로젝트 소개

 

[ 개발 기간 ]

2024.08.11 ~ 2024.10.30

 

[ 프로젝트 개요 ]

서울을 방문하는 외국인 관광객들이 허위 리뷰나 광고에 휘둘리지 않도록 하여 📍서울의 진짜 SPOT📍을 추천해주는 서비스

 

 

📌 프로젝트 내용

 

[ 🗺️ 서울시 25개 구 정보 제공 ]

서울시 각 구에 대해 미숙할 외국인들을 위해 각 구의 간략한 분위기, 교통, 카테고리별 상위 장소 등의 정보 제공

목적 : 서울시 각 구의 개요(분위기) 파악

 

[ 📍 카테고리별 장소 리스트 제공 ]

카테고리 별 지도에 마커 표시로 시각화 및 리스트의 간략한 정보(가게명, 리뷰수) 제공

목적 : 장소의 밀집도 확인 및 장소 개요 파악

 

[ 📝 장소 세부 정보 및 리뷰 제공 ]

선택한 가게 / 관광지의 주요 정보(리뷰 수, 긍/부정 리뷰 수, 광고성 리뷰 수, 주소, 전화번호, 영업시간 등) 및 리뷰 정보(긍/부정 감정, 날짜, 각종 태그, 내용) 제공

목적 : 대시보드를 통해 장소에 대한 전반적인 정보를 쉽게 파악하고, 장소 선정 및 계획 수립을 보다 효율적으로 할 수 있도록 지원함

 

+) 자세한 내용은 SeoulPOT GitHub 참고

 

 

📌 프로젝트 내 역할

 

2024.08 ~ 2024.10 프로젝트 리더

 

2024.08 (1st agile) 설계 및 데이터 수집

  • 데이터, 웹 아키텍처 설계
  • GraphQL을 활용한 음식점, 카페 네이버 리뷰 크롤링 (약 2,000,000개)

 

2024.09 (2nd agile) 유사도 기반 광고성 리뷰 추출/제거, 사용자 리뷰 감정 분석

  • TF-IDF 유사도 기반 광고성 리뷰 추출 및 제거
  • Mistral(LLM)을 활용한 데이터 라벨링
  • KoELECTRA 전이 학습 수행 (구축한 평가용 데이터셋 기준 Zero Shot ACC 0.98 달성)

 

2024.10 (3rd agile) 사용자 리뷰 업데이트 배치 프로세스 개발

  • AWS 기반 자동화 파이프라인 배포
  • Airflow를 활용한 데이터 수집, 분류, 번역 등의 8개 과정 자동화 구축 (70% 시간 절감)

 

 

📌 결과

 

2024.10 ~ 2024.11 약 50일간 배포

3,786 방문자 확보 🎉

방문자 게시판 의견 기반 UI 개선 및 데이터 업데이트 수행

 

 

📌 느낀 점

 

 좋은 기회로 인공지능을 활용한 웹 배포에 관심이 있던 5인이 모여 시작한 토이 프로젝트였다. 팀원들의 개발 경험이 제각각이라 1차에는 설계, 웹 구축의 위주로 개발에 익숙해지는 시간을 가졌고, 갈수록 태스크에 맞는 주 기능들을 붙여나가며 리뷰 업데이트 프로세스가 포함된 최종 배포를 완료할 수 있었다.

 

 프로젝트 도중 지원자가 있어 팀은 5인, 6인, 최종 8인이 되었다. 팀원이 점점 늘어남에 따라 팀장으로써 약간의 부담이 있었으나, 주변인들의 조언을 얻어 회의 방법도 바꿔보고, 파트도 나눠보는 등 다양한 시도를 통해 안정적인 팀을 꾸려나갈 수 있던 것 같아 다행이었다. 공동체 생활에서의 크고 작은 점을 많이 느낄 수 있어 뜻 깊은 경험이었다.

 

 또한 모델 강화 및 자동화 시간 단축 등 수치적으로 성과가 보이는 태스크를 개발하며 느꼈던 점은, 문제 정의와 설계의 과정이 굉장히 중요하다는 점이다. 마냥 이것저것 시도해보기보다는 설계를 통해 현재의 상황과 문제가 무엇이고, 어떤 점을 해결해야 할지 고민해보며 개발하며 많은 성능을 낼 수 있었다.

 

 특히나 라벨이 없는 크롤링한 리뷰 데이터를 분류하기 위해 직접 평가용 데이터셋을 구축하고, 적절한 LLM을 활용하여 라벨링을 수행하는 등 “라벨이 없다.”는 문제점을 해결한 과정이 값진 경험으로 다가왔다.

 

 앞으로도 데이터와 인공지능을 적재적소에 활용하여 다양한 문제들을 해결해 나아가며 성장하고 싶다.