상위 질문
타임라인
채팅
관점
박진영 (공학자)
성균관대학교 교수 위키백과, 무료 백과사전
Remove ads
박진영(영어: JinYeong Bak)은 대한민국의 성균관대학교 컴퓨팅대학 부교수이자 자연어 처리·기계 학습 연구자이다.[1][2] 대화 모델링과 언어 모델 평가, 외부 메모리 기반 적응 기법(PEMA) 등을 연구하며, Human Language Intelligence Lab(HLI Lab)을 이끈다.[1] 박진영은 2013~2014년에 Microsoft Research Asia(MSRA)에서 Chin‑Yew Lin과 함께 지식 마이닝 그룹 연구 인턴으로 근무했고, 트위터 대화의 자기폭로 주제 모델을 개발하였다.[3][4]
Remove ads
학력
경력
연구와 학문적 관점
박진영의 연구는 대화 데이터에서 화자 정보를 모델에 통합하는 방법, 자동 응답 평가, 대규모 언어 모델의 외부 메모리 기반 적응에 초점을 둔다.[5][6] 대화 상황과 화자에 민감한 평가 모델(SSREM)을 제안하여 사람 평가와의 상관을 높였고,[5] 변분 계층 구조를 이용해 화자 정보를 전달하는 대화 생성 모델을 제시하였다.[7] 또한 기밀 PLM의 전 가중치 접근 없이 외부 메모리와 LoRA 유사 어댑터를 이용해 효율적으로 적응하는 PEMA를 공동 제안하였다.[6]
주요 활동
관점
박진영은 언어 모델 연구의 재현성·책임성 확보를 위해 평가 기준의 투명성과 데이터 프라이버시를 중시하며, 학부·대학원 교육에서 확률모형·NLP·AI 윤리를 정규 교과로 운영해 기초 역량을 강조한다.[3][1]
연구 성과
논문
- 김현진; 김영진; 박진영 (2024). 「PEMA: 오프사이트 조정형 플러그인 외부 메모리 적응(영문: PEMA: An Offsite‑Tunable Plug‑in External Memory Adaptation for Language Models)」, NAACL 2024(Long Papers). doi:10.18653/v1/2024.naacl-long.336.[6]
- 이 논문은 거대 언어모델의 전 가중치 접근 없이 외부 메모리를 이용해 적응하는 방법을 제안한다. 학습 단계에서 문맥 표현과 목표 토큰을 쌍으로 저장해 메모리를 만들고 어댑터로 표현을 재구성한다. 추론 단계에서는 PEMA와 PLM의 확률을 점진적으로 섞는 방식을 사용한다. 기계번역과 문체 변환 과제에서 메모리·시간 효율과 성능을 함께 개선했다. 데이터 기밀성과 모델 기밀성을 동시에 고려한 설계를 강조한다.
- 정대진; 박진영 (2023). 「대화 감정‑원인 쌍 추출을 위한 안내형 전문가 혼합(영문: Conversational Emotion‑Cause Pair Extraction with Guided Mixture of Experts)」, EACL 2023. doi:10.48550/arXiv.2302.09079.[11]
- 이 연구는 대화문에서 감정과 그 원인을 짝지어 찾는 문제를 다룬다. 화자 정보 등 대화 특징을 반영하는 전문가 혼합 구조를 도입한다. 뉴스 중심 데이터의 한계를 보완하기 위해 대화 데이터에 맞춘 표본화와 지시 신호를 사용한다. 제안 모델은 기존 방법보다 일관된 쌍 예측을 보였다. 대화 기반 감정 분석의 실제 활용 가능성을 넓혔다.
- 박진영; 오앨리스 (2019). 「변분 계층적 사용자 기반 대화 모델(영문: Variational Hierarchical User‑based Conversation Model)」, EMNLP‑IJCNLP 2019. doi:10.18653/v1/D19-1202.[7]
- 이 논문은 화자 정보를 잡아 대화 맥락으로 전달하는 변분 생성 모델을 제안한다. 화자 정체성을 확률 변수로 모델링해 과적합된 개인화 응답을 줄인다. 트위터 대화 데이터로 실험해 기존 모델 대비 더 자연스러운 응답 생성을 보였다. 구성 요소의 역할을 정량·정성 분석으로 검증했다. 화자 중심 대화 생성의 기본 틀을 제시한다.
- 박진영; 린친유; 오앨리스 (2014). 「트위터 대화의 자기폭로 주제 모델(영문: Self‑disclosure topic model for classifying and analyzing Twitter conversations)」, EMNLP 2014. doi:10.3115/v1/D14-1213.[4]
- 온라인 대화에서 자기폭로를 자동 분류·분석하는 주제 모델을 제안한다. 의미 있는 자기폭로 신호를 반영하도록 주제 구조를 설계했다. 수작업 태깅과 비교해 높은 일치도를 보였고 대규모 데이터에서 관계 특성을 설명했다. 결과는 사회적 지지와 친밀감 연구에 데이터 기반 근거를 제공한다. 사회과학·NLP 융합 연구의 초기 사례로 평가된다.
- 박진영; 오앨리스 (2020). 「화자 민감 응답 평가 모델(영문: Speaker Sensitive Response Evaluation Model)」, ACL 2020. doi:10.18653/v1/2020.acl-main.568.[5]
- 대화 맥락과 화자 정보를 함께 고려해 생성 응답의 품질을 자동 평가한다. 다화자 트위터 대화로 학습하고 사람 평가와의 상관을 확인했다. 영화 대사로의 전이 가능성도 보였다. 자동 평가의 데이터 의존성과 일반화 문제를 논의한다. 대화형 AI 평가 연구의 기준을 확장했다.
Remove ads
대외 활동
같이 보기
연표
연표 (펼치기)
Remove ads
외부 링크
각주
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads