박진영 (공학자)

박진영(영어: JinYeong Bak)은 대한민국의 성균관대학교 컴퓨팅대학 부교수이자 자연어 처리·기계 학습 연구자이다.^[1]^[2] 대화 모델링과 언어 모델 평가, 외부 메모리 기반 적응 기법(PEMA) 등을 연구하며, Human Language Intelligence Lab(HLI Lab)을 이끈다.^[1] 박진영은 2013~2014년에 Microsoft Research Asia(MSRA)에서 Chin‑Yew Lin과 함께 지식 마이닝 그룹 연구 인턴으로 근무했고, 트위터 대화의 자기폭로 주제 모델을 개발하였다.^[3]^[4]

간략 정보 박진영박진영, 성별 ...

박진영 박진영
성별	남성
국적	대한민국
시민권	대한민국
학력	성균관대학교 한국과학기술원
직업	컴퓨터 과학자 대학교수
활동 기간	2013년~현재
고용주	성균관대학교
소속	Human Language Intelligence Lab(HLI Lab)
현직	성균관대학교 컴퓨팅학과 부교수
전직	성균관대학교 컴퓨팅학과 조교수(2020~2024) United Nations Global Pulse Lab 자카르타 주니어 데이터 과학 인턴(2016) Microsoft Research Asia 연구 인턴(2013~2014)
칭호	부교수
칭호 기간	2024년 9월~현재
상훈	KAIST 우수 박사학위논문상(2020)
웹사이트	https://nosyu.kr/

간략 정보 박진영 ...

박진영
한글 표기:	박진영
한자 표기:	朴秦永
개정 로마자 표기:	Bak Jin-yeong
매큔-라이샤워 표기:	Pak Chin-yŏng
예일 표기:	Pak Cin-yeng
공식 로마자 표기:	JinYeong Bak

Remove ads

학력

성균관대학교 컴퓨터공학 학사(2004~2011).^[3]
한국과학기술원 전산학부 석사(2011~2013).^[3]
한국과학기술원 전산학부 박사(2013~2020, 우수 박사학위논문상 수상).^[3]

경력

2013~2014: Microsoft Research Asia, 지식 마이닝 그룹 연구 인턴(지도: Chin‑Yew Lin).^[3]
2016: United Nations Global Pulse Lab 자카르타, 주니어 데이터 과학 인턴(트위터 키워드 확장 토픽 모델 기법 개발).^[3]
2020~2024: 성균관대학교 컴퓨팅대학 소프트웨어학과 조교수(HLI Lab 설립 및 운영).^[1]^[3]
2024~현재: 성균관대학교 컴퓨팅대학 소프트웨어학과 부교수(언어모델 평가·메모리 적응 연구 주도).^[1]

연구와 학문적 관점

박진영의 연구는 대화 데이터에서 화자 정보를 모델에 통합하는 방법, 자동 응답 평가, 대규모 언어 모델의 외부 메모리 기반 적응에 초점을 둔다.^[5]^[6] 대화 상황과 화자에 민감한 평가 모델(SSREM)을 제안하여 사람 평가와의 상관을 높였고,^[5] 변분 계층 구조를 이용해 화자 정보를 전달하는 대화 생성 모델을 제시하였다.^[7] 또한 기밀 PLM의 전 가중치 접근 없이 외부 메모리와 LoRA 유사 어댑터를 이용해 효율적으로 적응하는 PEMA를 공동 제안하였다.^[6]

주요 활동

HLI Lab 운영: 연구 주제로 ‘AI 생성물 평가’, ‘텍스트 속 인간행동 시뮬레이션’, ‘대규모 데이터로부터 통찰 발견’을 제시하고 대학원생 지도를 수행한다.^[8]
학술·커뮤니티: Google Scholar·OpenReview 등 공개 검증 플랫폼에서 연구 산출을 공유한다.^[9]^[10]
초청 강연 및 협업: RIKEN, POSTECH, 조지아공대 등에서 언어모델·기억 구조·자기훈련 주제로 강연했다.^[3]

관점

박진영은 언어 모델 연구의 재현성·책임성 확보를 위해 평가 기준의 투명성과 데이터 프라이버시를 중시하며, 학부·대학원 교육에서 확률모형·NLP·AI 윤리를 정규 교과로 운영해 기초 역량을 강조한다.^[3]^[1]

연구 성과

대화의 자기폭로 분석: 트위터 대화에서 자기폭로를 분류·분석하는 주제 모델을 제안해 대규모 온라인 대화의 사회적 행동을 정량적으로 탐구하였다.^[4]
화자 민감 자동평가: 화자 맥락 유사도를 반영한 응답 품질 자동평가 모델(SSREM)을 고안하여 사람 평가와의 상관을 향상시켰다.^[5]
외부 메모리 기반 적응(PEMA): PLM 가중치 전체 공개 없이 외부 메모리와 LoRA 유사 어댑터만으로 오프사이트 튜닝을 가능케 하는 적응 방식을 공동으로 제안하였다.^[6]

논문

김현진; 김영진; 박진영 (2024). 「PEMA: 오프사이트 조정형 플러그인 외부 메모리 적응(영문: PEMA: An Offsite‑Tunable Plug‑in External Memory Adaptation for Language Models)」, NAACL 2024(Long Papers). doi:10.18653/v1/2024.naacl-long.336.^[6]

이 논문은 거대 언어모델의 전 가중치 접근 없이 외부 메모리를 이용해 적응하는 방법을 제안한다. 학습 단계에서 문맥 표현과 목표 토큰을 쌍으로 저장해 메모리를 만들고 어댑터로 표현을 재구성한다. 추론 단계에서는 PEMA와 PLM의 확률을 점진적으로 섞는 방식을 사용한다. 기계번역과 문체 변환 과제에서 메모리·시간 효율과 성능을 함께 개선했다. 데이터 기밀성과 모델 기밀성을 동시에 고려한 설계를 강조한다.

정대진; 박진영 (2023). 「대화 감정‑원인 쌍 추출을 위한 안내형 전문가 혼합(영문: Conversational Emotion‑Cause Pair Extraction with Guided Mixture of Experts)」, EACL 2023. doi:10.48550/arXiv.2302.09079.^[11]

이 연구는 대화문에서 감정과 그 원인을 짝지어 찾는 문제를 다룬다. 화자 정보 등 대화 특징을 반영하는 전문가 혼합 구조를 도입한다. 뉴스 중심 데이터의 한계를 보완하기 위해 대화 데이터에 맞춘 표본화와 지시 신호를 사용한다. 제안 모델은 기존 방법보다 일관된 쌍 예측을 보였다. 대화 기반 감정 분석의 실제 활용 가능성을 넓혔다.

박진영; 오앨리스 (2019). 「변분 계층적 사용자 기반 대화 모델(영문: Variational Hierarchical User‑based Conversation Model)」, EMNLP‑IJCNLP 2019. doi:10.18653/v1/D19-1202.^[7]

이 논문은 화자 정보를 잡아 대화 맥락으로 전달하는 변분 생성 모델을 제안한다. 화자 정체성을 확률 변수로 모델링해 과적합된 개인화 응답을 줄인다. 트위터 대화 데이터로 실험해 기존 모델 대비 더 자연스러운 응답 생성을 보였다. 구성 요소의 역할을 정량·정성 분석으로 검증했다. 화자 중심 대화 생성의 기본 틀을 제시한다.

박진영; 린친유; 오앨리스 (2014). 「트위터 대화의 자기폭로 주제 모델(영문: Self‑disclosure topic model for classifying and analyzing Twitter conversations)」, EMNLP 2014. doi:10.3115/v1/D14-1213.^[4]

온라인 대화에서 자기폭로를 자동 분류·분석하는 주제 모델을 제안한다. 의미 있는 자기폭로 신호를 반영하도록 주제 구조를 설계했다. 수작업 태깅과 비교해 높은 일치도를 보였고 대규모 데이터에서 관계 특성을 설명했다. 결과는 사회적 지지와 친밀감 연구에 데이터 기반 근거를 제공한다. 사회과학·NLP 융합 연구의 초기 사례로 평가된다.

박진영; 오앨리스 (2020). 「화자 민감 응답 평가 모델(영문: Speaker Sensitive Response Evaluation Model)」, ACL 2020. doi:10.18653/v1/2020.acl-main.568.^[5]

대화 맥락과 화자 정보를 함께 고려해 생성 응답의 품질을 자동 평가한다. 다화자 트위터 대화로 학습하고 사람 평가와의 상관을 확인했다. 영화 대사로의 전이 가능성도 보였다. 자동 평가의 데이터 의존성과 일반화 문제를 논의한다. 대화형 AI 평가 연구의 기준을 확장했다.

Remove ads

대외 활동

국제 학술 커뮤니티 활동(OpenReview·ACL 계열 학술대회 논문 발표 및 심사 참여).^[12]
강연: RIKEN(도쿄), 조지아공대(애틀랜타), POSTECH(포항) 등에서 언어모델 기억 구조·자가훈련·가치정렬 주제로 초청 강연.^[3]

같이 보기

크리스티안 다네스쿠-니쿨레스쿠-미질

연표

연표 (펼치기)

자세한 정보 연도, 사건 ...

연도	사건	출처
2004~2011	성균관대학교 컴퓨터공학 학사 과정 이수
2011~2013	한국과학기술원 컴퓨터과학 석사 과정 이수
2013.09~2014.02	Microsoft Research Asia 지식 마이닝 그룹 연구 인턴 참여
2014	트위터 대화 자기폭로 주제 모델 연구(EMNLP 2014) 발표
2016.06~2016.08	UN Global Pulse Lab 자카르타 주니어 데이터 과학 인턴
2019	변분 계층적 사용자 기반 대화 모델 연구(EMNLP‑IJCNLP 2019) 발표
2020	화자 민감 응답 평가 모델 연구(ACL 2020) 발표, KAIST 전산학 박사
2020.09	성균관대학교 소프트웨어학과 조교수 부임, HLI Lab 운영 시작
2024.06	외부 메모리 기반 적응 기법 PEMA(NAACL 2024) 발표(공저)
2024.09	성균관대학교 소프트웨어학과 부교수 승진

Remove ads

외부 링크

각주

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads