Overview
Financial RAG Challenge๋ ๋ฐฉ๋ํ ์ฌ๋ฌด ๋ฌธ์๋ฅผ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ Retrieval-Augmented Generation (RAG) ์์คํ ์ ๋ฐ์ ์ ๋ชฉํ๋ก ํ๋ ๋ํ์ ๋๋ค. ์ฐธ๊ฐ์๋ค์ ๋๊ท๋ชจ ๊ธ์ต ๋ฐ์ดํฐ์ ์์ ๊ด๋ จ ๋ฌธ๋งฅ์ ๊ฒ์ํ๋ ์์คํ ์ ๊ตฌ์ถํด์ผ ํ๋ฉฐ, ๊ธ์ต ์ฉ์ด, ์ฐ์ ํน์ ์ ์ธ์ด, ์์น ๋ฐ์ดํฐ ๋ฑ ์ค์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฅ๋ ฅ์ด ์๊ตฌ๋ฉ๋๋ค. ํตํฉ๋ ํ ์คํธ ๋ฐ ํ ํ์์ ์ฌ๋ฌด ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ฌ nDCG@10 ์งํ๋ก ๊ฒ์ ์ ํ๋๋ฅผ ํ๊ฐํ๋ฉฐ, ์์ ํต๊ณผ ์์ 10๊ฐ ํ์ ๋ณธ์ ์์ KB์ฆ๊ถ ๋ณธ์ฌ์์ ํ๋ ์ ํ ์ด์ ์ ์งํํ์ต๋๋ค.


๊ธฐ์ ์ ๊ตฌํ

๋ณต์กํ ๊ธ์ต ์ฉ์ด์ ํผํฉ ๋ฐ์ดํฐ ํน์ฑ์ ๊ณ ๋ คํ RAG pipeline์ ๊ฐ๋ฐํ์ต๋๋ค. Query Expansion์ ํตํด GPT-4o-mini๋ก ๊ธ์ต ์ฝ์ด์ ๊ธฐ์ ๋ณ ์ฉ์ด๋ฅผ ์ฒ๋ฆฌํ๊ณ , BM25 sparse retrieval๊ณผ dense semantic search๋ฅผ ๊ฒฐํฉํ Hybrid Search๋ฅผ ๊ตฌํํ์ต๋๋ค. ์์ฝ ๋ฐ table extraction์ ํตํ corpus refinement ๊ณผ์ ์ ๊ฑฐ์ณ, ColBERT์ Voyage AI ๋ฑ ์ต์ reranking model์ ์ ์ฉํ์ฌ ํนํ tabular dataset์์ ์๋นํ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ์ต๋๋ค.

์๋น์ค ์ ์
Query Chain ๋ถ์ framework
๊ธฐ์ ์ ๊ตฌํ์ ๋์ด, ์ฐ์์ ์ธ ์ง์ ํจํด์ ํตํด ์ฌ์ฉ์์ ์ ์ฌ์ ์๋๋ฅผ ํ์ ํ๋ Query Chain ๋ถ์ framework๋ฅผ ์ ์ํ์ต๋๋ค. DIKW(Data-Information-Knowledge-Wisdom) ๊ณ์ธต๊ตฌ์กฐ์ Goal-Means analysis๋ฅผ ํ์ฉํ์ฌ ์ฌ์ฉ์์ ์ฐ์ ์ง์๊ฐ ์ด๋ป๊ฒ ๋ ๊น์ ํฌ์ ๋ชฉํ์ ์์ฌ๊ฒฐ์ ๊ณผ์ ์ ๋๋ฌ๋ด๋์ง ๋ถ์ํ์ต๋๋ค.


์ง๋ฅํ ํฌ์ ํ๋ซํผ ZIRASys
์ด๋ฌํ insight๋ฅผ ๋ฐํ์ผ๋ก ๊ฐ์ธํ๋ content ์์ฑ, ์ค์๊ฐ ๊ธ์ต ๋ฐ์ดํฐ ์ฒ๋ฆฌ, community ๊ธฐ๋ฐ insight๋ฅผ ์ ๊ณตํ๋ ์ง๋ฅํ ํฌ์ platform ZIRASys๋ฅผ ์ ์ํ์ฌ, ๊ธฐ์กด rule-based chatbot์ ์ฌ์ฉ์ needs๋ฅผ ์ดํดํ๊ณ ์์ธกํ๋ ๋ฅ๋์ ๊ธ์ต assistant๋ก ์ ํํ๋ ๋ฐฉ์์ ์ ์ํ์ต๋๋ค.

