Resources
  • 저널
  • R&D 칼럼
기업 AI 도입, 생각보다 쉽지 않은 7가지 이유
2025.05.28

✅ 제목: 기업 AI 도입, 생각보다 쉽지 않은 7가지 이유


이제는 작업마다 AI 모델을 따로 개발하지 않아도, 하나의 모델로 여러 업무를 유연하게 처리할 수 있는 시대입니다. 문서 요약, 이메일 응답, 보고서 작성 등 생성형 AI는 이미 많은 이들의 일상 속에 자연스럽게 자리 잡고 있습니다.


기업 역시 단순히 구성원 개개인이 AI를 활용하는 단계를 넘어, AI를 조직 전체의 업무 흐름에 통합하는 단계로 나아가고 있습니다. 하지만 개인의 활용과 조직 차원의 도입은 본질적으로 다릅니다. 많은 기업들이 기대한 만큼의 성과를 내지 못하는 이유는, 기술의 부족이 아니라 AI가 제대로 작동할 수 있는 구조가 아직 마련되어 있지 않기 때문입니다.



1.생성형 AI의 특성을 고려하지 않은 도입


기업의 AI 전환(AX)이 성공하려면, 기술을 적용하기에 앞서 ‘어떤 문제에 AI를 써야 할지’부터 명확히 해야 합니다. 생성형 AI는 텍스트나 이미지를 이해하고, 새로운 결과물을 만들어내는 데 특화된 기술입니다. 대표적으로는 대형 언어모델(LLM)과 비전-언어모델(VLM)이 있습니다.


이런 모델들은 입력된 자연어 또는 이미지를 기반으로 가장 가능성 높은 출력을 예측해내는 방식으로 작동합니다. 설명, 요약, 변환, 문장 생성처럼 ‘무언가를 만들어내는’ 작업에는 강점을 가지지만, 수치 계산이나 논리적 추론이 필요한 작업에는 맞지 않습니다. 예를 들어, 센서 데이터에서 이상 징후를 찾거나 통계 기반 분석을 수행하는 데는 기존 머신러닝이 더 효율적입니다.


반면 이런 작업에는 생성형 AI가 잘 맞습니다:
- 자연어로 DB 검색하기(Text-to-SQL)
- 탐지된 이벤트 기반 보고서 자동 생성
- 문서 요약, 이메일 응답, 초안 작성 등


이처럼 생성형 AI의 도입 가능성을 판단할 때는 두 가지 조건을 먼저 점검해야 합니다.


첫째, 입력 데이터가 텍스트 또는 이미지인지 확인합니다.

둘째, 목표가 무언가를 생성하거나 변환하는 작업인지 점검합니다.



2.생성형 AI의 한계: 제한된 데이터 입력 규모


생성형 AI는 본질적으로 소규모의 비정형 데이터(텍스트와 이미지처럼 구조화되어 있지 않은 정보)를 처리하는 데 특화된 기술입니다. 즉 한 번에 처리할 수 있는 입력의 길이에도 제한이 있기 때문에, 대량의 데이터를 한꺼번에 입력하는 것이 불가능합니다. 이 제한을 'context length'라고 부릅니다.


이러한 한계를 극복하기 위한 현실적인 접근 방식이 바로 RAG(Retrieval-Augmented Generation)입니다. 예를 들어, 생성형 AI에 입력하고 싶은 문서가 총 10만 개라고 가정했을 때, 이 모든 문서를 한 번에 처리할 수는 없습니다. 따라서 이 중에서 ‘정말 필요한’ 일부 문서만 골라서 생성형 AI에 입력해야 합니다. 문제는, 사용자가 매번 수동으로 해당 문서를 선택하는 것이 불가능하다는 점입니다. 이를 해결하기 위해 ‘검색(Retrieval)’ 단계가 필요합니다. 즉, 시스템이 스스로 문서들을 검색하여 생성(G) 단계에 적절한 입력만 선별해주는 구조가 필요합니다.


결국, 검색(R)을 잘못하면 생성(G)의 결과도 의미를 잃게 됩니다. 아무리 뛰어난 언어모델을 사용하더라도, 부정확한 정보에 기반한 생성은 실제 업무에서 활용될 수 없습니다. 따라서 생성형 AI의 실질적인 성능은 생성 자체보다 검색 품질에 훨씬 더 크게 의존합니다.



3.검색 기능이 잘 작동할 수 있는 구조의 부족




RAG 구조에서 가장 중요한 건 ‘무엇을 생성하느냐’보다 ‘무엇을 검색하느냐’입니다. 검색 없이 대규모 언어모델(LLM)에 데이터를 미리 학습시키는 방식, 즉 파인튜닝(fine-tuning)은 비용이 매우 높고, 환각(hallucination) 가능성도 크며, 최신 정보 반영이 어렵다는 구조적 한계를 안고 있습니다. 어제 튜닝한 모델이 오늘 생성된 데이터를 전혀 알지 못할 수 있다는 점에서, 이는 기업 환경에 적합한 방식이라 보기 어렵습니다. 생성은 상용이나 오픈소스 LLM이 이미 잘 해줍니다. 비용도 낮고, 품질도 높고, 운영도 쉽습니다. 최근에는 프롬프트 작성도 간단해졌고, 오픈소스 모델도 경쟁력이 있습니다.


하지만 검색은 그렇지 않습니다. 검색 품질은 단순히 좋은 기술을 사온다고 해결되지 않습니다. 기업 내부의 IT 인프라, 데이터 시스템, 보안 정책 등 수많은 조건에 영향을 받습니다.


검색이 제대로 작동하기 위해서는 다음과 같은 두 가지 관점에서 준비가 필요합니다.


첫째, 데이터 접근·연동·운영 관점입니다. 여기에는 서버나 DB의 종류, 레거시 시스템 의존도, 데이터 업데이트 주기, 버전 관리 방식, 민감정보 포함 여부, 방화벽과 망 분리 정책, DRM, SSO, IAM, 데이터 관리 주체 등의 요소가 포함됩니다.


둘째, 데이터 정형화 관점입니다. 기업 내에는 PPT, 엑셀, PDF, 스캔된 이미지, 사진 등 다양한 형태의 비정형 데이터가 존재합니다. 이 데이터들이 어떤 카테고리에 속하고, 어떤 유형인지, 양이 얼마나 되는지에 대한 정리가 선행되어야 검색이 가능하고, 그 결과로 생성도 의미를 가질 수 있습니다.


이런 점에서 보면, 생성형 AI의 도입 성패는 결국 검색이 가능한 구조를 갖추고 있는지에 달려 있다고 볼 수 있습니다. 검색이 제대로 작동한다면 생성은 그리 어렵지 않습니다.


S2W의 기업용 생성형 AI 플랫폼인 SAIP는 이와 같은 RAG 구조의 핵심, 특히 '검색(R)'의 정확도와 실시간 연결성에 최적화되어 설계되어 있습니다. 다양한 데이터 환경에 맞춰 정형·비정형 정보를 통합하고, 최신 데이터 기반의 검색 성능을 확보함으로써 실제 업무 흐름에 밀착된 생성형 AI 구현이 가능합니다.



4.문서 중심 데이터의 정형화 부족


문서 기반 데이터의 정형화는 특히 생성형 AI가 정확한 검색과 생성을 수행하기 위해 필수적인 단계입니다. 그러나 실제 기업 내 문서는 단순 텍스트가 아닌 PDF, 엑셀, 이미지 등 복잡한 포맷으로 구성되어 있으며, 표와 다중 헤더, 병합 셀, 페이지 분리 등 다양한 구조적 장벽이 존재합니다.


예를 들어, 한 PDF 문서에 연속된 표가 여러 페이지에 걸쳐 분산되어 있을 경우, 사람은 그것이 하나의 의미 단위임을 직관적으로 인지하지만, 생성형 AI는 이를 각기 다른 정보 조각으로 인식합니다. 또 하나의 표 안에 병합된 셀(merged cell)이 있을 경우, 그 안의 구조적 관계가 손실됩니다. 이처럼 문서 내의 테이블 구조, 헤더 계층 간 종속성 등을 복원해주는 전처리 과정 없이는, 정확한 검색과 생성이 불가능합니다.


이러한 정형화 작업이 완료된 후에야 RAG 구조가 정상적으로 작동하며, 검색된 정보에 기반한 신뢰도 높은 생성을 기대할 수 있습니다. 결국 정형화는 RAG의 선결 조건이며, 특히 문서 중심의 데이터가 많은 기업일수록 AI 도입을 위해 가장 먼저 정비해야 할 영역입니다.



5.우리 조직에 맞는 문제 설정과 도입 전략 부족


생성형 AI를 도입할 때 가장 먼저 던져야 할 질문은 "우리가 풀고자 하는 문제는 무엇인가?"입니다. 조직마다 데이터의 형태, 정비 수준, 업무 흐름이 다르기 때문에 AI로 해결할 수 있는 문제 역시 다르게 정의되어야 합니다.


접근 방식은 크게 두 가지입니다.


첫째, 정형화가 잘 되어 있는 소규모 데이터를 활용해 빠르게 서비스화하는 것입니다.

둘째, 정형화가 되지 않은 대규모 데이터를 생성형 AI 기반 전처리로 정리하고 구조화하는 것입니다.


장기적으로는 정형화 기반 구축이 더 중요하지만, 현실적으로는 1번의 방향으로 먼저 빠르게 시도하고 작게 성공하는 것이 필요합니다. 작게 시작한 과제를 통해 실무자와 조직이 생성형 AI의 가능성과 한계를 체감하고, 다음 단계로 확장할 수 있는 추진력을 얻을 수 있기 때문입니다.


기업이 SAIP를 도입하기 전에, 기업의 데이터 구조와 업무 특성을 충분히 이해하기 위한 컨설팅 과정을 함께 진행합니다. 이 과정을 통해 기업이 어떤 문제를 AI로 해결할 수 있는지, 어떤 방식이 현실적이고 효과적인지에 대해 함께 논의합니다. 실제로 SAIP는 현대제철(제조), 롯데멤버스(유통)처럼 복잡한 데이터 처리 환경을 가진 산업에서 이미 적용되어 왔으며, 각 조직의 조건에 맞는 단계적 도입을 지원해 왔습니다.



6.시범 적용과 같은 작고 빠른 실행의 부재


작게 시작하기 위해서는 다음 조건을 갖춘 업무 영역이 적합합니다.


- 데이터가 잘 모여 있고, 접근이 쉬운 영역
- 단순 반복 작업이 많고 워크플로우가 단순한 영역
- 민감 정보가 포함되지 않았거나, 익명화가 쉬운 영역
- ChatGPT 등의 상용 서비스를 활용해 이미 가능성을 체감한 영역


이러한 조건이 갖춰졌다면, 복잡한 온프레미스 시스템 구축보다는 API 기반의 클라우드 서비스로 빠르게 시범 서비스를 운영해보는 것이 훨씬 효과적일 수 있습니다.



7.검색과 정형화를 고려하지 않은 모델 중심의 판단


많은 기업이 LLM을 선택할 때 벤치마크나 리더보드 순위를 참고하지만, 이는 매우 제한된 조건에서 측정된 값입니다. 실제 우리 조직의 데이터와 업무에 잘 작동할지 여부는 별개입니다.


특히 RAG 구조를 염두에 둔다면, 생성(G) 성능보다 검색(R) 성능, 더 구체적으로는 검색이 잘 되도록 돕는 데이터 정형화 및 전처리 모듈이 있는지가 훨씬 중요합니다.


LLM 자체는 오픈소스와 상용 모두 빠르게 발전하고 있으며, 수개월 전 파인튜닝한 모델이 최신 공개 모델보다 성능이 떨어지는 경우도 많습니다. 따라서 특정 모델에 고정되기보다, 실제 데이터에 맞는 솔루션을 유연하게 선택하는 것이 더 중요합니다.



8.결론: 작게 시작하고, 빠르게 검증하기


생성형 AI 도입의 성패는 세 가지에 달려 있습니다.


1. 우리가 풀고자 하는 문제가 AI로 풀 수 있는 문제인가?
2. 데이터를 AI와 연결할 수 있는 구조(RAG)가 마련되어 있는가?
3. 작고 명확한 시도가 선행되었는가?


민감하지 않은 내부 데이터부터 시작해 AI의 도입 목적을 명확히 해야, 조직 내 AI 도입을 설득력 있게 추진할 수 있습니다. 기술은 계속 발전합니다. 중요한 건 지금 우리 조직이 그 기술을 얼마나 활용할 준비가 되어 있는가입니다.


SAIP는 이러한 과정을 현실화하는 데 특화된 플랫폼입니다. 컨설팅, 정형화, 통합까지 통합된 서비스를 바탕으로, 사내에 생성형 AI를 도입할 때 마주치는 기술적 장벽을 낮춰주고, 조직이 큰 규모의 기술을 보다 효과적으로 레버리지할 수 있도록 설계되어 있습니다.


작게 시작하고, 빠르게 검증하고, 명확한 목표 설정해 추진하기. 지금 가장 현실적인 전략입니다.



🧑‍💻 칼럼 작성자: S2W AI팀


👉 AI 기술 문의하기: https://s2w.inc/ko/contact


*S2W의 생성형 AI 플랫폼 SAIP에 대해 더 알고 싶다면, 아래에서 자세한 내용을 확인해 주세요.


목록