
링크브릭스 호라이즌 에이아이, 글로벌 리더보드 첫 톱 10…“에이전트 개발 가능한 플랫폼 개발”
국내 스타트업이 오랜만에 글로벌 대형언어모델(LLM) 리더보드에서 상위권에 진입했다. 지난해 시즌 2로 허깅페이스 리더보드가 개편된 이후, 톱 10을 기록한 것은 처음이다.
링크브릭스 자회사 링크브릭스 호라이즌AI는 24일 현재 허깅페이스 오픈LLM 리더보드에서 평균 47.34%의 정확도로 10위를 기록 중이다.
이 회사의 모델 ‘Saxo/Linkbricks-Horizon-AI-Avengers-V1-32B’는 ‘큐원(Qwen/Qwen2.5-32B-Instruct)’을 베이스로 미세조정한 모델이다.
GPU ‘H100-80G’ 8개를 이용, 35% 정도 매개변수에 감독미세조정(SFT) 및 직접선호최적화(DPO)를 거쳐 다국어 능력을 강화했다. 토크나이저는 단어 확장 없이 베이스 모델 그대로 사용했다.
특히 다양한 언어권을 기반으로 8000만건에 달하는 뉴스 및 위키 코퍼스를 이용했다. 작업별 일본어-한국어-중국어-영어 교차 학습 데이터와 수학 및 논리 판단 데이터를 통해 ‘언어 교차 증강 처리’와 ‘복잡한 논리 문제’에 대응할 수 있다고 강조했다.
또 고객 리뷰나 소셜 포스팅 등의 비정형 데이터 고차원 분석 및 코딩과 작문, 수학, 논리 판단 등을 강화한 것이 특징이다.
이 모델을 개발한 호라이즌AI는 지난 1월 ‘소형언어모델(sLM) 구축 플랫폼’ 개발을 목표로 설립됐다. 데이터 사이언티스트인 지윤성 이사가 의장을 맡았다. 지윤성 대표는 지난해부터 언어모델 개발 도구 ‘호라이즌AI’ 플랫폼을 통해 일본어 소형언어모델(sLM)을 개발했는데, 일본어 LLM 성능을 가리는 ‘오픈 JP-LLM 리더보드’에서도 상위권을 기록했다.
또, 국내 오픈 Ko-LLM 리더보드 시즌2에서도 지난해 11월 정상을 차지하는 등 국내는 물론 일본과 미국에서 모두 상위권을 휩쓸었다.
지윤성 대표는 24일 호라이즌AI를 ‘에이전트 개발 플랫폼’으로 확장했으며, 현재 개발을 마치고 출시를 앞두고 있다고 밝혔다.
그는 “LLM은 이미 포화 상태인 만큼, 이제는 기존 LLM을 잘 조합해 실용적인 서비스를 만드는 것이 업계 트렌드”라며 “호라이즌AI는 LLM의 추론 영역을 담당, 실제 서비스를 위한 도구로 자리 잡을 것”이라고 말했다.
특히 인공지능(AI) 에이전트를 쉽게 개발하도록 지원하는 것에 중점을 뒀다고 전했다. 이를 통해 여러 LLM을 활용, ‘딥 리서치’와 같은 도구를 제작할 수 있다는 설명이다.
실제로 사용자는 호라이즌AI에서 ‘드래그 앤드 드롭’만으로 LLM을 레고 블록처럼 조합, 에이전트 서비스를 만들어 낼 수 있다고 소개했다. 지윤성 이사는 “필요한 기능은 플랫폼 내 모두 구축돼 있기 때문에, 사용자는 조합만 하면 되는 방식”이라고 말했다.
번거로운 미세조정 없이도 애플리케이션을 제작할 수 있다는 설명이다. 관련 특허 3가지의 출원도 완료한 상태다. 완성한 애플리케이션은 키오스크나 로봇 등에 다양하게 적용이 가능하다.
[ 출처 : AI타임스]
A Korean startup has entered the top ranks of the global large language model (LLM) leaderboard for the first time in a while. Since the Hugging Face leaderboard was revamped into Season 2 last year, this is the first time a Korean company has made it into the top 10.
As of the 24th, Linkbricks’ subsidiary, Linkbricks HorizonAI, ranks 10th on the Hugging Face OpenLLM leaderboard with an average accuracy of 47.34%.
The company’s model, ‘Saxo/Linkbricks-Horizon-AI-Avengers-V1-32B’, is a fine-tuned version of ‘Qwen/Qwen2.5-32B-Instruct’. Using eight H100-80G GPUs, the model has undergone supervised fine-tuning (SFT) and direct preference optimization (DPO) on approximately 35% of its parameters to enhance its multilingual capabilities. The tokenizer remains the same as the base model without any word expansions.
Notably, the model utilizes 80 million news and Wikipedia corpus entries from various language groups. It has also been trained with cross-language learning data for Japanese, Korean, Chinese, and English, along with mathematical and logical reasoning datasets. This allows it to handle “cross-language augmentation processing” and solve “complex logical problems”.
Additionally, the model excels in high-dimensional analysis of unstructured data, such as customer reviews and social media posts. It has also been optimized for coding, writing, mathematics, and logical reasoning.
Linkbricks Horizon-AI’s Vision and Achievements
Linkbricks Horizon-AI, the developer of this model, was founded in January with the goal of building a small language model (sLM) development platform. The company is chaired by Ji Yun Sung(Benedict Ji), a data scientist.
Since last year, Ji has been developing a Japanese small language model (sLM) through the HorizonAI platform, which serves as a language model development tool. His model has also ranked high in the Open JP-LLM leaderboard, which assesses the performance of Japanese LLMs.
Moreover, in November 2023, HorizonAI topped the domestic Open Ko-LLM leaderboard (Season 2), securing leading positions in South Korea, Japan, and the United States.
On the 24th, Ji announced that HorizonAI has expanded into an “agent development platform” and is now completed and set for release.
“Since the LLM market is already saturated, the industry trend is now shifting towards efficiently combining existing LLMs to create practical services,” he stated. “HorizonAI will serve as a tool for real-world applications by handling the inference aspect of LLMs.”
Simplifying AI Agent Development
Linkbricks Horizon-AI is particularly focused on making AI agent development easier. By leveraging multiple LLMs, the platform can facilitate the creation of tools like ‘Deep Research’.
Users can drag and drop LLM components like Lego blocks within the HorizonAI platform to create their own agent services.
“All the necessary functions are built into the platform, so users only need to combine the elements,” Ji explained.
This means applications can be developed without complex fine-tuning. Additionally, the company has filed three related patents.
The completed applications can be applied to kiosks, robots, and various other systems, further expanding their practical use.
韓国のスタートアップが久しぶりにグローバル大規模言語モデル(LLM)リーダーボードの上位にランクインした。昨年、Hugging Faceのリーダーボードがシーズン2に改編されて以来、トップ10入りは今回が初めてである。
現在(24日)、Linkbricksの子会社 Linkbricks HorizonAI は、Hugging Face OpenLLMリーダーボードで**平均正確度47.34%**を記録し、第10位にランクインしている。
同社のモデル 「Saxo/Linkbricks-Horizon-AI-Avengers-V1-32B」 は、「Qwen/Qwen2.5-32B-Instruct」 をベースにファインチューニングされたものだ。
8基のH100-80G GPUを使用し、パラメータの約**35%に対して教師ありファインチューニング(SFT)および直接選好最適化(DPO)**を実施し、多言語能力を強化した。トークナイザーはベースモデルのまま、単語拡張は行われていない。
特に、多様な言語圏のニュース・ウィキコーパス8000万件を活用。また、日本語・韓国語・中国語・英語のクロス学習データに加え、数学や論理判断データを学習させたことで、
✅ 「言語間クロス拡張処理」
✅ 「複雑な論理問題の解決」
が可能になったと強調している。
さらに、顧客レビューやSNS投稿などの非構造化データの高度分析や、コーディング・ライティング・数学・論理判断の機能も強化された。
Linkbricks Horizon-AIのビジョンと実績
Linkbricks Horizon-AIは、2024年1月に設立され、「小型言語モデル(sLM)構築プラットフォーム」の開発を目指している。データサイエンティストの**ジ・ユンソン(Ji Yoon-seong)**氏が会長を務める。
ジ氏は昨年から**「HorizonAI」プラットフォームを通じて日本語の小型言語モデル(sLM)を開発しており、日本語LLMの性能を評価する「Open JP-LLMリーダーボード」**でも上位にランクインしている。
また、2023年11月には、韓国の**「Open Ko-LLMリーダーボード(シーズン2)」で第1位を獲得**するなど、韓国のみならず、日本や米国でもトップレベルの成績を収めた。
24日、ジ氏はHorizonAIを「エージェント開発プラットフォーム」に拡張し、現在開発を完了し、リリース準備中であることを発表した。
「LLM市場はすでに飽和状態のため、今後は既存のLLMを効果的に組み合わせて実用的なサービスを作ることが業界のトレンドになる」
「HorizonAIはLLMの推論領域を担当し、実際のサービス開発ツールとして活用される」
AIエージェント開発の簡素化
Linkbricks Horizon-AIはAIエージェント開発を簡単にすることに重点を置いている。複数のLLMを活用し、「ディープリサーチ」などのツールを開発できる。
実際に、ユーザーはHorizonAI上で「ドラッグ&ドロップ」するだけで、 レゴブロックのようにLLMを組み合わせてエージェントサービスを作成できる。
「必要な機能はすべてプラットフォーム内に揃っているため、ユーザーは組み合わせるだけでよい」 とジ氏は述べた。
これにより、煩雑なファインチューニングなしでアプリケーションを開発可能となる。また、関連特許3件の出願も完了している。
完成したアプリケーションは、キオスクやロボットなど多様なシステムに適用可能である。