한국 AI의 글로벌 혁신

비드래프트, AI 메타인지 벤치마크 'FINAL Bench' 공개

서울AI허브 입주사 비드래프트가 AI의 '메타인지' 능력을 정량 측정하는 벤치마크를 허깅페이스와 GitHub에 동시 공개. 글로벌 5위 기록.

📍 서울신문·2026.02.27

📊

비드래프트, AGI 평가 글로벌 표준 'FINAL Bench' 제시

최봉석 기자가 재작성한 심층 보도. AI가 얼마나 많이 아는가가 아니라, 자기가 모르는 것을 아는가를 묻는 시대가 열렸다.

📍 아시아경제·2026.02.27

💡

[IT조선] 비드래프트, 세계 최초 AI 메타인지 벤치마크 공개

허깅페이스 데이터셋 글로벌 5위·금주의 스페이스 동시 선정. 메타인지 없는 AGI는 눈 감고 운전하는 것과 같다.

📍 IT조선·2026.02.27

🔬

[비하인드] 비드래프트 FINAL Bench 상세 분석 보도

김현수 기자의 상세 게재. 100과제×15도메인×8 TICOS 메타인지 유형×3난이도 설계 구조 심층 분석.

📍 비하인드·2026.02.27

🤝

[매일경제] 웨어큐브, AI 비드래프트와 전략적 업무 협약 및 공동연구개발 계약

1000만불 수출의탑 수상 글로벌 방송 모니터 제조사 웨어큐브(25년 업력)가 비드래프트와 전략적 업무 협약 체결. 미국 FOX·넷플릭스·ESPN 등 수출 실적 보유 강소기업과 허깅페이스 글로벌 상위 AI 스타트업의 신사업·공동 기술 개발 추진.

📍 매일경제·2026.03

📰

[IT조선] 비드래프트 AI 혁신 기술 보도

비드래프트의 최신 AI 기술과 글로벌 성과를 조명한 IT조선 특집 기사.

📍 IT조선·2026.02

⚡

[IT조선] 비드래프트 AI 스타트업 심층 리포트

서울AI허브 입주 AI 스타트업 비드래프트의 글로벌 경쟁력과 기술 로드맵 분석.

📍 IT조선·2026.02

🔬

Research & Products

🎰

📍 Hugging Face Space·Live

Prompt & Dump: AI NPC 수만 마리가 자본주의를 시뮬레이션하면 버블이 생길까?

100배 레버리지 생존 실험. 수백 개 AI 에이전트가 30분 만에 전원 파산 → 메타인지 파이프라인 적용 후 6대 발견. 개체 합리성 ≠ 집단 합리성 입증.

📍 HF Blog·2026.02.24

🏟️

🚀 Live Demo

Prompt & Dump — AI NPC Trading Arena (Live)

30개 티커, 10가지 성격 아키타입, 19개 자동 스케줄러. 메타인지 장착 AI 에이전트들의 실시간 트레이딩 아레나.

🛡️

MARL: 파인튜닝 없이 LLM 환각을 줄이는 런타임 미들웨어

코드 한 줄(base_url)만 바꾸면 모든 LLM에 즉시 적용. 5단계 멀티에이전트 자기검증 파이프라인으로 최고난도 과제 성능 70%+ 향상, 개선의 94.8%가 Error Recovery에서 발생.

📍 HF Blog·2026.03.09

📊

ALL Bench: AI 벤치마크의 구조적 문제와 통합 평가 프레임워크

91개 AI 모델 통합 평가. MMLU 90%+ 포화 시대, 5축 복합 점수 설계와 3단계 교차검증 신뢰도 시스템. 6개 모달리티 커버.

📍 HF Blog·2026.03.08

🔏

StealthMark — AI 생성 콘텐츠 비가시 워터마크 기술

AI가 생성한 이미지·영상에 육안으로 보이지 않는 워터마크를 삽입하여 출처를 추적하는 보안 기술.

📍 VIDraft·Live

📄

📝 Official Paper v5

FINAL Bench: Measuring Functional Metacognitive Reasoning in LLMs

Kim, Kim, Choi, Jang (2026). 인지심리학 40년 이론(Nelson & Narens)을 AI에 최초 적용한 메타인지 벤치마크 연구.

📄 PDF · SSRN·2026

🏅

🚀 Leaderboard

FINAL Bench — Proprietary Models Leaderboard

GPT-4o, Claude, Gemini 등 상용 모델 전용 FINAL Bench 리더보드. 클로즈드 소스 모델들의 메타인지 능력 비교.

📍 Hugging Face·Live

⚙️

💻 Open Source

FINAL Bench — GitHub 전체 코드 공개

평가 데이터셋(100개 과제), 채점 코드, 심판 프롬프트 전체를 GitHub에 오픈소스로 공개. 누구나 자신의 모델을 평가 가능.

📍 GitHub·Apache 2.0

📌

이전 주요 뉴스

🧬

Darwin: AI 모델을 진화시키는 혁신 플랫폼

이종 AI 모델 교배로 성능 30% 향상된 새 모델을 1-2시간만에 자동 생성. 기존 대비 1/1,000 비용.

📍 Hugging Face

🧠

jetXA: AGI 1단계 달성 플랫폼

AGI 필수 7대 지능 중 창조·언어 지능 완성. SOMA(자기 지휘형 오케스트레이션)와 SLAI 기술 구현.

📍 VIDraft

🌱

NH농협, 될성부른 25개 스타트업 — 비드래프트 선정

NH농협 오픈이노베이션에 비드래프트 공식 선정. AI부터 로봇까지 유망 스타트업 육성 프로그램.

📍 머니투데이

⚡

"소버린AI 파운데이션 모델은 핵무기급 전략자산"

K-AI 생태계 구축을 위한 민관 협력의 중요성 — 포쓰저널 현장 리포트.

📍 포쓰저널

🇯🇵

🌏 글로벌

일본에서 VIDraft R1984 모델 분석 리뷰

일본 AI 커뮤니티에서 VIDraft의 R1984 모델을 상세 분석하고 높은 평가.

📍 Note.com (Japan)

🇨🇳

🌏 글로벌

중국 MiraclePlus의 VIDraft 심층 분석

중국 테크 미디어가 VIDraft의 AI 기술과 비즈니스 모델을 특집 기사로 분석.

📍 MiraclePlus (China)

🎨

AI가 그린 '지블리 스타일' 한 달 만에 50만 다운로드

한국 AI 팀이 개발한 지블리 스타일 이미지 생성 모델이 글로벌 폭발적 인기.

📍 Brunch

🏥