제조업에서 Graph-RAG와 온톨로지를 도입하는 이유

안녕하세요. 퓨처워크랩에서 온톨로지와 RAG 기반 솔루션을 만들고 있는 AI Engineer, 박나연입니다.
제조업 현장에는 도면, SOP, 품질 문서, 점검표 등 형식도 제각각이고, 버전도 섞여 있는 문서들이 끝없이 쌓입니다. 퓨처워크랩은 이 문서들을 온톨로지로 의미 있게 엮고, RAG로 실시간 검색·질의응답이 가능하도록 만드는 것에 집중하고 있습니다.
이 기술 블로그에서는 저희가 어떤 문제의식에서 출발했는지, 온톨로지와 RAG를 어떻게 설계·구현했는지, 그리고 실제 제조 현장에 어떻게 적용하고 있는지까지 조금은 깊게, 하지만 이해하기 쉽게 하나씩 풀어보려 합니다.

온톨로지와 GraphRAG, 제조업에서 필요한 이유

여러분은 산업현장에서 발생하는 데이터를 어떤 형태로 저장하여 인사이트를 도출하고 계신가요?

퓨처워크랩은 다양한 산업 현장의 데이터를 다루며, 문서 기반 정보부터 센서 로그, 공정 이벤트 등 서로 다른 형태의 데이터들을 분석하고 연결하고 있습니다. 이러한 데이터들은 각각 독립적으로 존재하지 않으며, 서로 여러 요소가 얽혀 있는 구조를 이룹니다. 즉, 데이터를 단순히 ‘개별 항목’으로 보는 것이 아니라, 서로 영향을 주고받는 관계망으로 바라보는 관점이 필요합니다.

이를 위해 퓨처워크랩은 Graph 기반의 온톨로지를 활용합니다. 온톨로지를 근간으로 하여, 산업 현장의 데이터를 그래프 데이터베이스(Graph Database)로 구현합니다. 데이터를 그래프 형태로 구조화하며 무엇이 무엇과 연결되어 있는가를 표현하고 따라가면서 새로운 인사이트를 발견할 수 있는데요. 즉 데이터 간 관계를 데이터 구조 안에 내재화하고, 더 나아가 그 연결 속에서 새로운 인사이트를 발견하는 산업 데이터 혁신을 추진하고 있습니다.

온톨로지의 의미

온톨로지란? 특정 도메인(domain) 내의 개념(entities)과 그들 간의 관계(relationships)를 명확하게 정의하고 구조화한 지식 표현 모델로, 일종의 지식맵

[그림 1] 검색 증상 생성 (https://aws.amazon.com/ko/what-is/retrieval-augmented-generation/)

데이터를 그래프로 구조화했다면, 이제 중요한 것은 그 방대한 그래프 속에서 필요한 정보를 어떻게 탐색하고 이해할 것인가입니다. 이때 활용되는 접근 방식이 RAG(Retrieval-Augmented Generation)인데요.

RAG의 장점

RAG는 '검색 증강 생성(Retrieval-Augmented Generation)'의 약자로, 대규모 언어모델(LLM)의 생성 능력에 검색(retrieval) 단계를 결합한 방식입니다. LLM이 사용자에게 인사이트를 전달하기 전에 외부 데이터베이스에서 관련 정보를 검색하고, 이를 바탕으로 더 정확하고 신뢰성 있는 답변을 만드는 기술입니다.

이를 통해 실제 데이터에 근거한 응답을 생성할 수 있게 되는데, 특히 산업 현장처럼 정형, 비정형 데이터가 혼재된 환경에서는, LLM이 검색 단계를 거침으로써 답변의 신뢰성을 확보할 수 있습니다.

RAG의 한계

하지만 RAG의 한계도 명확합니다. RAG는 일반적으로 벡터 검색(Vector Search) 기반으로 동작하게 되는데, 이는 문서나 텍스트를 임베딩(embedding)한 후 유사도(similarity)를 계산하여 가장 비슷한 청크(chunk)를 가져오는 방식입니다.

이 방법은 서로 다른 맥락이 얽힌 질문에는 충분히 대응하기 어렵습니다.

예를 들어,

🧑‍💻 “A 설비에서 발생한 이상 증상과 관련된 공정 단계와 점검 절차는 무엇인가?”

라는 질문에 대한 해답은 단일 문서에서 찾지 못할 수 있습니다.

센서 로그에는 이상 신호가, 점검 매뉴얼에는 절차가, 보고서에는 실제 조치 이력이 들어 있기 때문이죠.

각 데이터가 서로의 관계를 기준으로 연결되어 있을 때 시스템은 이 경로를 따라가며 [이상 발생 → 공정 단계 → 점검 및 조치]로 이어지는 다단계(멀티홉) 추론을 수행할 수 있습니다.

[그림 2] 멀티홉 검색 방식에 대응하는 그래프 검색 (https://www.zyphra.com/post/understanding-graph-based-rag-and-multi-hop-question-answering)

GRAPH-RAG 도입 이유

이처럼 벡터 검색만으로는 맥락을 충분히 이해하기 어려운 경우에도, 충분한 맥락을 탐색할 수 있도록 GraphRAG을 도입할 수 있습니다.

GraphRAG은 기존 RAG의 검색 방식을 확장해, 그래프 구조 위에서 의미적으로 연결된 정보를 탐색합니다. 여기서 퓨처워크랩이 주목하고 있는 핵심은 ‘업무 및 산업 현장의 데이터 간의 연결’을 데이터 구조로 표현해, 데이터 간의 연결을 따라가며 필요한 맥락을 찾아내 자동화를 위한 인사이트를 도출합니다.

마무리

퓨처워크랩은 벡터 검색의 한계를 넘어, 데이터를 그래프 형태로 구조화해 관계 기반 검색을 가능하게 하는 GraphRAG을 도입했습니다. GraphRAG은 서로 연결된 데이터의 의미적 관계를 따라가며 맥락을 파악하고, LLM이 더 깊은 이해와 다단계 추론을 수행할 수 있도록 지원합니다.