국제 학술지 네이처, 피인용 횟수 상위 논문 25건 선정
국제 학술지 네이처(Nature)가 지난 20여 년간 실제로 가장 많이 인용된 과학 논문 25건을 공개했다./pixabay
신종 코로나바이러스 감염증(코로나19)를 극복한 메신저리보핵산(mRNA) 백신, 유전자 정보를 자유롭게 조작할 수 있는 크리스퍼 유전자 가위, 우주의 비밀을 밝힌 힉스 입자와 중력파의 발견 등은 21세기 과학계의 주요 업적으로 꼽힌다. 하지만 지난 20년간 가장 많이 읽히고 이용된 논문의 주인공은 따로 있었다. 새로운 이론보다 다른 연구에 도움을 주는 도구였다.
국제 학술지 네이처(Nature)는 대표적인 학술 인용 데이터베이스 5곳을 기반으로 21세기 이후 발표된 수천만 편의 논문을 분석해 피인용 횟수 상위 논문 25편을 선정했다고 15일(현지 시각) 밝혔다.
지난 20년간 가장 많이 인용된 논문은 마이크로소프트(MS) 연구진이 2016년 발표한 ‘딥 레지듀얼 네트워크(ResNet)’ 관련 연구였다. 인공지능(AI)이 기존보다 신경망 구조를 심층 학습할 수 있도록 하는 기술을 다뤘다. 구글 학술 검색 기준으로는 25만 회 이상, 학술 데이터베이스 ‘웹오브사이언스’에서도 10만 회 넘게 다른 논문들에 인용됐다. 이 논문은 바둑 AI 알파고와 단백질 구조 예측 AI 알파폴드, 대화형 AI 챗GPT 등의 핵심 기반이 됐다.
다른 AI 분야 논문들도 다수 순위에 올랐다. 2012년 발표된 이미지 인식용 AI 모델 ‘알렉스넷(AlexNet)’, 2017년 발표된 언어 모델의 핵심 구조인 ‘트랜스포머’도 있다. 각각 이미지 인식과 대형 언어 모델(LLM)의 출발점이 된 연구들이다. 트랜스포머 기술은 챗GPT와 같은 대화형 AI가 문장을 이해하고 생성할 수 있게 만든 핵심 기술이다.
지난해 노벨 물리학상을 받은 제프리 힌턴 캐나다 토론토대 교수는 “AI 관련 논문이 높은 피인용 횟수를 기록한 이유는 AI 분야는 전통적인 과학보다 훨씬 빠르게 논문이 생산되고 활용되기 때문”이라며 “의료, 금융, 로봇, 번역 등 다양한 분야에서 폭넓게 활용되기 때문에 자연스럽게 피인용 횟수가 높아지는 경향이 있다”고 말했다. 일부 연구자들은 초기 AI 기계학습(머신러닝) 논문 대부분이 누구나 정보에 접근할 수 있는 오픈 소스라 피인용 횟수가 높아졌다고 밝히기도 했다.
생명과학과 의학 연구에 쓰이는 분석 도구들도 순위에 들었다. 유전자 양을 정하는 기법인 중합효소 연쇄 반응(PCR)과 유전자 활성 변화를 계산하는 방법을 정리한 논문, X선의 산란 패턴을 분석해 분자의 원자 구조를 밝히는 프로그램 모음, 전 세계 암 발생률과 사망률을 정리한 세계보건기구(WHO)의 보고서, 정신 질환 진단 기준을 정리한 DSM-5도 최상위권에 들었다.
전 세계 연구자들이 분석에 활용하는 통계 프로그램이나 소프트웨어도 포함됐다. 파이선(Python)이라는 컴퓨터 언어로 만든 머신러닝 도구 ‘사이킷런(scikit-learn)’, 생물학 실험 데이터를 분석하는 lme4 패키지, 실험에 필요한 최소 샘플 수를 계산해 주는 G*Power 도구 등이다.
이에 대해 미샤 테플리츠키 미시간대 교수는 “과학자들은 새로운 이론이나 발견을 중시한다고 말하지만, 실제로는 유용한 도구와 방법을 더 자주 인용하는 경향이 있다”고 분석했다.
참고로 네이처에 따르면 사상 최대 피인용 횟수를 기록한 논문은 1951년 국제 학술지 ‘생화학 저널(Journal of Biological Chemistry)’에 실린 용액 내 단백질의 양을 측정한 연구다. 해당 논문은 웹오브사이언스에서 35만회 이상 피인용 횟수를 기록했다.
참고 자료
Nature(2025), DOI: https://doi.org/10.1038/d41586-025-01125-9
- Copyright ⓒ 조선비즈 & Chosun.com -
Copyright © 조선비즈. 무단전재 및 재배포 금지.