한동훈 딸 논문은 누가 썼을까?
에세이가 아니라 논문이다
한동훈 장관 후보자는 고등학생 딸, Alex Han의 논문 의혹이 제기되자 이렇게 변명한 바 있다.
“후보자 딸이 재학 중 장기간 작성해 온 글을 전자문서화하기 위하여 업로드한 것인데 석박사 이상만이 작성할 수 있는 것으로 연상되는 ‘논문’이라고 칭하는 것은 전형적인 왜곡 과장”이라고 했다.
- 조선일보 5월 5일자 보도
한 후보자는 입장문을 내고 “기사에서 논문이라고 허위 과장해 언급한 글은 (딸이) 3년에 걸쳐 학교 과제 등을 통해 작성한 에세이, 보고서 등을 한꺼번에 업로드한 것”이라고 반박했다.
- 동아일보 5월 6일자 보도
과연 그럴까? 아래 논문은 Alex Han의 구글 스칼라 프로필에 나열된 논문들 중 가장 최근 것이다. 이 논문은 전자/컴퓨터공학 분야 세계 최대 학술 단체인 IEEE에서 주관한 2022 Second International Conference on Artificial Intelligence and Smart Energy (ICAIS) 학회에서 발표됐다.
이 학회 요강에는 피어 리뷰를 거친다고 명시돼 있고, 게재 승인된 논문은 IEEE 논문 검색 사이트에서 조회된다. 즉, 이것은 명백한 논문이고, 한동훈 후보자의 답변은 사실이 아니다. 고등학생 신분으로 세계적인 학술단체 IEEE 학회에 논문을 발표한 당신 딸의 놀라운 성과를 왜 폄훼하는지 모르겠다.
2. 수상한 방글라데시인 공저자
Alex Han의 IEEE 논문을 공저한 사람은 Maria Sultana Keya라는 방글라데시인이다. Alex Han은 Maria를 도대체 어떻게 알았을까?
Maria는 2021년 1월에 방글라데시 Daffodil 대학교를 졸업하고, 2021년 4월부터는 Jahangirnagar 대학교에서 컴퓨터과학 석사과정을 밟고 있었다. Alex Han과 공저한 것으로 돼있는 IEEE 논문은 2021년 10월경에 제출됐는데 여기에 Maria의 소속 기관으로, 석사과정을 밟고 있는 J 대학이 아니라 이미 9개월 전에 졸업한 학부 출신 D 대학이 적혀있다! 석사과정 학생 입장에서는 학부 졸업 자체가 대단한 성취라고 생각하기 마련인데, 자기가 여전히 학부생인 것처럼 쓴다?
과연 Alex Han은 Maria와 공동 연구를 하기는커녕 얘기해본 적은 있을까?
3. 논문 자체도 표절 소지가 다분
캐글은 머신러닝 연구자들의 온라인 커뮤니티로서 각종 데이터셋과 코드가 공유된다. 아래 그림에 두 개의 그래프가 있는데, 위는 어느 캐글 사용자의 예제에서 따온 것이고, 아래는 Alex Han의 논문에 실린 그림(Figure 4)이다. 둘은 완벽히 일치한다. 똑같은 데이터셋에 똑같은 코드를 돌렸으니까.
논문의 Figure 2도 캐글의 예제에 나온 것이다. 일부 그림이 겹치는 정도의 문제가 아니라, 각종 요인이 우울증 발생률에 미치는 영향을 이해하고, 발생률을 예측하는데 몇 가지 머신러닝 알고리즘의 정확도를 비교한다는 논문의 요지 자체가 캐글 예제와 동일하다.
이 정도로 캐글의 예제에 의존하는 논문이라면 그 예제는 참고문헌에 포함돼 있어야 마땅하다. 그러나 본문에 “The dataset is collected from Kaggle.”라고 딱 한 줄 언급한 것이 전부다. 캐글의 공개된 데이터셋을 이용하는 것 자체는 문제가 아니고 이를 활용한 좋은 연구들도 많다. 위키피디아의 URL 까지도 매번 부지런히 인용 표시하는 꼼꼼한 저자가 왜 캐글의 예제는 참고문헌 목록에서 빠뜨렸을까?
이상의 사실을 종합하면 나는 이렇게 생각한다. 여기서부터는 뇌피셜이니 한동훈 검사님, 고소하지 말아주세요!
Alex Han측은 Maria가 학부생일 때 논문 초안을 사왔을 것이다. Maria가 다녔던 Daffodil 대학은 학부 졸업 요건으로 텀 프로젝트 리포트를 국제 학회에 발표해야 된다. 학생들이 형식적 논문 작성법에는 익숙하다는 얘기다. 그걸 서론 조금 다듬고 영어 교정해서 제출했을 것이다.
그런데 대필해주는 논문에 심혈을 기울일 사람이 있을까? 그러니 Maria도 캐글에서 적당한 예제 하나 골라서 적당히 돌려보고 해설만 덧붙인 것이다. 캐글 예제는 주로 코드와 결과 그래프만 나열돼 있어서 표절 검사기로는 잡히지 않아 이런 용도로 제격이다.
또한, 학술지는 약탈적 학술지(Predatory Journal) 문제로 블랙리스트가 만들어질 정도로 타이트하게 관리되지만, 학술대회는 아직 관리가 허술한 데다가 일부 저질 학술대회는 불행히도 IEEE와 같은 거대 학술 단체의 후광을 업고 있는 경우도 있어서 엉터리 스펙 쌓는데 악용될 소지가 다분하다.
논문을 대필시킨 것이 사실이라면 ‘입시컨설팅’ 받는 것과는 완전히 다른 차원의 문제다. 한동훈 법무부 장관 후보자가 답할 차례다.