권순호
About
AI Researcher | ML engineer | data scientist
수치를 통해 얻은 인사이트를 사용자에게 제공하는 서비스에 관심이 있습니다.
NLP, CV, Unstructured data등 다양한 도메인 task의 경험이 있습니다.
수학, 통계에 대한 이해를 바탕으로 각 모델의 개념과 원리를 이해하고자 노력해왔습니다.
논문 리딩과 프로젝트 활동을 통해 새로운 분야에 대하여 이해하고 구현할수 있습니다.
Contact
GitHub
Email
Work Experience
2023 — Now
AI Engineer at Tain.ai
- 금융 도메인에서 제공하고자 하는 서비스에 필요한 AI 모델의 기술을 연구, 개발, 적용하였습니다.
- 서비스 제공을 위해 필요한 데이터와 파이프라인을 구축하는 방법을 고민하였습니다.
- 다양한 모델을 사용해보고 최적의 모델을 찾아내어 서비스와 연결하는데 노력하였습니다.
2021 — 2023
- AI 연구원으로 입사하여 ML, DL 모델 연구 개발 하였습니다
- 머신러닝 모델 백엔드 API를 운영 하였습니다
- 정답이 없는 문제에 대한 접근법, 검증법 그리고 해결 방법을 연구 분석하였습니다
- 게임 데이터 분석을 통해 정성적인 개념을 정량적으로 수치화하는 수식을 연구 하였습니다
Projects
2023
- 사용자가 개발 없이 쇼핑몰 프로모션을 진행할 수 있도록 도와주는 에디터 개발 프로젝트
- 사용자가 원하는 키워드를 입력하면, 프로모션의 타이틀, 설명 등을 AI가 자동으로 생성
- 데이터 수집을 위해 Object Detection, OCR 등의 이미지 처리 모델을 활용하여 효율적인 데이터 수집 및 처리 파이프라인 구현
2023
대화형 금융 AI Judy 개발
- 사용자에게 금융 관련 대화에 답변하는 금융 AI 어시스턴트 개발 프로젝트
- 스쿼드 관리자로서 스쿼드의 업무 관리 및 전체 프로덕트 맥락 조율
- 프롬프트 엔지니어링, 질문 의도 분류, 종목 필터링, 데이터 임베딩 등 기술을 활용
- 데이터 수집과 저장 방식 및 파이프라인 설계및 테스트
- BC카드 페이북과 연 1.2억 계약
- Judy App 기준 한달동안 평균 daily retention 약 70%
2023
포트폴리오 안정성을 위한 종목 제안
- 기대 수익률이 감소하지 않으면서 MDD가 낮아지도록 하는 Minimum Volatility Portfolio 제안
- Black-Litterman model과 Memory-based CF를 이용한 추천 모델
2022
소환사 플레이 스타일 segmentation 연구 개발
- 롤 플레이 성향을 추론 하여 나의 장단점을 인지하고 나와 잘 맞는 소환사를 찾도록 도와주기 위한 프로젝트
- 인 게임 지표 contrastive learning으로 소환사의 플레이 스타일 feature 추출
- feature segmentation으로 소환사 플레이 스타일 추론
2022
- 소환사의 현상을 파악하고 단점을 극복하기 위한 목표를 제시하여 승리 하도록 돕는 유로 서비스
- 분석 데이터의 가설검증을 통한 신뢰도 있는 데이터 제공
- 승률 예측 모델을 기반으로 인게임 피드백 제공
- 제안 목표 달성시 목표 티어 도달 확률 제공
- 2022년 8월 오픈 후 2700장 판매
2022
league of legends 지표 개발
- 소환사의 다양한 플레이를 해석하기 위하여 정성적인 개념을 정량적 지표로 개발
- 목표 지표의 성질을 잘 나타내는 가설들을 검증하며 진행
- 한타, 치명적인 죽음, 귀환, 다이브 등등 다양한 지표 개발 (일부 지표 2023 Lck 지표로 적용 예정)
2022
인분 모델 재구현
- LoL 게임 중 소환사의 승리 공헌도를 정량화하는 ML모델
- 기존 모델의 연산 비용을 낮추면서 정확도를 증가시키기 위한 프로젝트
- 승리 공헌도를 정량화 하는 새로운 수식 제안
- 연산 시간 약 1/10으로 단축
2022
In game 승패 영향력 추론 모델 개발
- 게임 초, 중, 후반 플레이에 따른 승패 영향력 추론 모델을 기반으로 소환사에게 피드백을 주기 위한 프로젝트
- 후반 영향력 상승이 가장큰 지표를 역으로 추적하여 초, 중반에 집중해야할 지표 제안
- 게임에 큰 영향을 준 죽음을 역으로 추적하여 게임 후반 챙겨야할 이벤트 제안
2022
듀오찾기 게시글 필터링 모델 개선
- 대리 광고 필터링 모델 개선과 혐오표현 필터링 기능을 추가하기 위한 프로젝트
- 대리 광고 필터링 정확도 상승 78.56% → 88.75% False positive 11.81% → 10.42%
- 혐오 표현 필터링 기능 정확도 71.97%, False positive 4.17%
2021
프로 유망주 선발 필터링
- 프로구단의 인재상을 만족하는 유망주 후보를 솔로랭크 데이터에서 선별하기 위한 프로젝트
- 프로구단의 인재상을 모델링하여 상위 10% 구간의 소환사중 유망주 후보 선별
- 나이 추론 모델을 개발하여 중, 고등학생 위주로 선별
Side Projects
2021
Object detection tasks, Model serving
- Naver Cloud Platform을 사용하여 웹 서버에 모델을 배포하는 프로젝트
- 배포된 모델은 입력한 이미지에서 사람의 위치를 감지하여 바운딩 박스로 출력해주는 모델
- Docker networking으로 데이터 인프라 구축
- Web container와 DB container 통신으로 사용자가 등록한 이미지 DB에 저장
- Web container와 Model serving container의 통신으로 등록된 이미지를 model로 예측 후 사용자에게 제공
2020
NLP classification tasks
- E-Commerce Site의 삼품 검색 결과에 대한 만족도를 예측하는 시스템
- 모델 파이프 라인 구성 (TF-IDF → LSA → Combining Similarity Features → oversampling → SVM)
- scikit-learn의 BaseEstimator와 TransformerMixin을 상속받는 custom estimators구현
- Oversampling을 포함하는 K-Fold Cross Validation 파이프라인을 병렬화하여 CPU사용량 최대화
- data augmentation과 oversampling으로 모델성능 개선(recall: 0.50 → 0.56, precision: 0.53 → 0.56)
- Deep learning model(BERT)과 Ensemble하여 평가 점수 향상(kappa scoer: 0.65 → 0.70)
- Kaggle competition evaluation metric(Kappa score) : 0.70529 (Private Score 기준 20위)
2020
Information retrieval ranking task
- 사용자가 입력한 검색어(상품)에 대한 결과(상품)들이 관련성에 따라 내림차순 목록으로 출력되는 모델
- Pair-wise Approach로 명시적인 순서가 없는 상품들에 검색어 별 순서 부여
- Joint BERT approach로 문맥을 고려한 모델 적용
- BERT Cost sensitive fine-tuning으로 Imbalance data에서 문제 해결
- 모델 평가 메트릭 nDCG, mAP : 0.85+
Writing
2021
데이터 인프라 구축과 모델을 웹에 배포 과정
2021
공부한 논문들을 review 하였습니다.
2020
사용자가 입력한 검색어(상품)에 대한 결과(상품)들이 관련성에 따라 내림차순 목록으로 출력되는 모델 개발기
2020
E-Commerce 데이터를 이용하여 사용자 만족도 예측 모델 개발기
Education
2012 — 2019
Major, Mathematics at Yeungnam University