Labs 목록으로 돌아가기

VCAI Labs | 26분전

VibeLabs|3일전

SkillsBench - AI 에이전트 스킬 벤치마크 논문 (arXiv)

86개 태스크, 11개 도메인에서 AI 에이전트 스킬의 효과를 측정하는 벤치마크. 큐레이팅된 스킬이 평균 16.2%p 성능 향상, 의료 분야 최대 +51.9%p. 자체 생성 스킬은 효과 없음을 발견. 7개 에이전트-모델 설정, 7,308개 실행 궤적 분석. 41명 공저.

2026. 03. 25
895 Views
94 Likes

상세 정보

상세 내용 (Body)을 불러올 수 없습니다. 해당 포스트는 외부 링크이거나 구조가 다릅니다.

VCAI Labs Notes

해당 자료는 크롤링 및 자체 데이터베이스로 관리되는 실험 연구 결과물입니다. 내부망을 통한 코드/데모 액세스는 담당 엔지니어 승인이 필요할 수 있습니다.