韩国法律推理基准测试LLM
Research Paper#Legal Reasoning, LLMs, Benchmarking🔬 Research|分析: 2026年1月3日 08:55•
发布: 2025年12月31日 02:35
•1分で読める
•ArXiv分析
本文介绍了一个新的基准测试 KCL,专门用于评估 LLM 在韩语中的法律推理能力。 关键贡献在于关注独立于知识的评估,通过问题级别的支持先例实现。 这使得能够更准确地评估推理技能,而与预先存在的知识分开。 该基准测试的两个组成部分 KCL-MCQA 和 KCL-Essay 提供了多项选择题和开放式问题格式,提供了全面的评估。 数据集和评估代码的发布是对研究界的宝贵贡献。