Project Detail

국제 저명 학술지 논문 기반 연구동향 분석 시스템

3명 | 데이터 수집·전처리, DB 설계, 백엔드 API 개발

2025.03.04 ~ 2025.11.13 기간
Tech 8개
Highlights 3개

프로젝트 개요

한 줄 요약

Springer/IEEE/ACM 논문 메타데이터를 수집·정제해 키워드/인용/연도 트렌드를 시각화하는 연구동향 분석 플랫폼.

주요 역할

3명 | 데이터 수집·전처리, DB 설계, 백엔드 API 개발

사용 기술

PythonDjangoMariaDBSeleniumPandasJavaScriptChart.jsBootstrap

핵심 기능

  • Selenium/Requests 기반 크롤링 파이프라인으로 제목·저자·기관·국가·키워드·연도 메타데이터 수집
  • Pandas로 중복 제거, 결측치 처리, 컬럼 표준화 등 정제 파이프라인 구축
  • 논문/저널/키워드/연도별 조회 REST API 설계 및 제공
  • Chart.js로 연도별 트렌드, 키워드 분포, 인용 추세 대시보드 구현
  • 논문/저자 상세 페이지 및 워드클라우드 시각화

트러블슈팅

  • 페이지 로딩 실패/세션 만료로 인한 누락 → 랜덤 딜레이 + 세션 재생성 + 재시도 로직
  • 대용량 조인 쿼리 성능 저하 → EXPLAIN 분석, 인덱스 설계, 불필요 컬럼 제거
  • 동시 Ajax 요청으로 차트 렌더링 오류 → 요청 분리, AbortController로 이전 요청 취소

성과 및 개선

  • ERD 기반 다대다 관계(논문-키워드) 중간 테이블 설계
  • 조회 성능 개선으로 대시보드 응답 안정화
  • 데이터 수집~시각화까지 풀스택 분석 파이프라인 구축

참고 링크

데모/영상 링크를 확인해 주세요.