국산 AI의 ‘그늘’… 네이버 ‘프롬 스크래치’와 중국 부품 논란이 남긴 질문
국내 최대 포털 네이버가 차세대 인공지능 ‘하이퍼클로바X’와 관련해 내세우는 ‘국산 AI’ 타이틀이 흔들리고 있다. 프롬 스크래치(from scratch)—즉, 순수하게 자체 기술과 국내 데이터를 기반으로 구축한 AI라는 대외적 입장과 달리, 실제로는 핵심 AI 학습, 특히 영상(눈)과 음성(귀) 처리에 필수적인 파이프라인이 중국산 모듈과 해외 오픈 소스를 대거 활용하고 있다는 사실이 드러났다. 이는 국대 AI의 자부심과 신뢰성 홍보에 비해 실제 소프트웨어 공급사슬의 현실, 즉 복잡한 의존성 및 기술 자립성 한계 면에서 논란의 중심에 서 있게 됐다.
AI 개발의 구조적 특성을 살펴볼 때, 일명 ‘프롬 스크래치’ 개발은 세계 최고 수준의 기술력과 오랜 축적, 엄청난 규모의 인력과 데이터가 필요한 영역이다. 하지만 대형 언어모델(LLM), 멀티모달 AI 시장의 급부상과 경쟁 심화 상황에서 네이버뿐 아니라 대부분의 글로벌 기업들이 인프라, 모델, 데이터, 핵심 모듈 세 단계에서 다양한 오픈소스와 상용 외부 라이브러리를 쓰는 것이 현실이다. 실제로 영상·음성 입력 처리의 경우, 소위 ‘눈’과 ‘귀’ 역할을 하는 비전·오디오 프리프로세싱 파이프라인은 중국 바이두와 텐센트, 미국의 페이스북 등에서 공개한 고성능 오픈소스가 사실상 표준처럼 통용된다. 이는 인공지능 로보틱스, 자율주행, 음성인식 등 2차 AI 산업 응용에서도 유사하게 반복된다.
네이버의 상황 역시 이 글로벌 흐름에서 크게 벗어나 있지 않다. 이번 논란은 AI의 완성도를 좌우하는 고난도 데이터 정제와 피처추출 부분에서, 네이버가 자체 개발 솔루션 외에 중국산으로 분류되는 AI 모듈(예를 들어 ‘파이플린’, ‘웨이브넷’ 변형 등)과 공개 코드를 대폭 적용했다는 사실에서 기인했다. 이는, 국내에서 ‘메이드 인 코리아’, ‘순수 국내 기술력’이라는 마케팅을 앞세우는 사이, 실제 제품의 상당한 부분이 해외 기술에 기대고 있다는 ‘컴포넌트 의존성’ 문제가 본격적으로 대두됐다는 점에서 의미가 깊다.
동시에 외부 오픈소스의 적극 활용은 글로벌 AI 생태계의 효율성과 확장성을 상징하지만, 중국산 모듈 이슈의 경우 ‘테크 자주권’ 및 보안·정치적 리스크(백도어·악성코드 포함) 논의로 번지면서 논란이 커지고 있다. 최근 미국, 유럽의 AI 컴플라이언스 강화, 글로벌 환경에서의 기술 블록화, 핵심 코어 투자 확대 요구가 나오는 것도 연장선상에 있다. 여기서 한국 빅테크가 실질적 ‘독립형’ 인공지능 생태계 구축에 어느 정도 근접했는지, 또는 ‘연결’과 ‘조립’ 산업에 머물지에 대한 근본적 자문이 필요하다.
사례를 더 살펴보면, 중국의 바이두 ‘ERINEye’, 텐센트 CV모델 등이 뉴럴 비전 파이프라인 세계시장 평균 20% 이상 점유율을 갖고 있으며, 한국은 이 분야 원천 특허와 논문 수요에서 현저히 뒤져 있다. 이 흐름은 삼성, 카카오, LG, SK 등 국내 주요 ICT 기업 대형 AI 연구소에서도 마찬가지여서, 비전·음성 분야에서 세계 최고 수준의 ‘상용급 완성’ 구현을 목표로 할 때 해외 및 중국 툴·데이터셋 활용이 불가피한 면이 있다. 네이버 외에도 삼성의 비서형, 카카오의 AI 상담·검색 서비스 등도 비슷한 구조다.
그럼에도 이 같은 현실적 한계를 소비자들이 납득할 수 있을지는 또 다른 문제다. 정부 조달, 공공 부문 도입, 민감 정보가 오가는 서비스라면 기술 출처, 보안성, 트러스트의 문제가 곧장 ‘정책 리스크’로 이어진다. ‘AI 주권’이라는 정책적 화두에 대한 이해관계자의 저항이나 신뢰 저하, 미묘한 대중 정서 반작용이 충분히 일어날 수 있다. 최근 정부와 국회에서 AI 공급망 투명성, 국산화 기준 심사 강화 요구가 나온 것도 여기에서 비롯된 흐름이다. 보다 근본적으로는, AI 경쟁 국면에서 단순히 ‘광고 포장된 국산화’가 아니라, 진정한 독자 생태계, 즉 자체 툴킷·코어 알고리즘·원천데이터 조성과 기술력 내재화라는 난관에 대한 투명한 커뮤니케이션과 사회적 합의가 우선되어야 한다는 점을 시사한다.
향후 흐름에선, 클라우드 인프라·IaaS·GPU 장비부터, 프리프로세싱 코어, 애플리케이션 레이어까지 각 모듈의 출처와 소유권, 보안성, 업데이트 방식이 더욱 면밀히 점검될 것이다. 글로벌 AI ‘경쟁’과 ‘연계’라는 모순적 요소 속에, 기술적 협력과 자립성 확보가 양립 가능하도록 구체적 로드맵이 필요하다. 그러면서 결코 가볍게 볼 수 없는 개인정보, 국방·언론 등 국가 전략 인프라의 ‘테크 리스크’도 동시에 짚고 가야 한다.
결국 이번 네이버 AI 논란은 ‘국산’이라는 포장의 실체를 어떤 방식으로 구체적이고 공개적으로 검증할지, 그리고 글로벌 분업화 환경에서 한국형 AI의 좌표와 방향성을 어떻게 사회적으로 결정해야 할지 시의적절한 문제 제기를 던지고 있다.
이상 — 유재혁 ([email protected])

