雷蛇发布Gaiadex工具,AI加速环保报告生成
LLM数学基准测试集FrontierMath公布,业界模型均败北
研究机构EpochAI公布了名为FrontierMath的全新AI模型数学基准测试集,旨在评估系列模型的数学推理能力。
初步测试发现,包括此前在其他测试中取得高分的模型如Claude3.5和GPT-4在FrontierMath中的解题成功率也均低于2%,显示出AI在解决高级数学问题时的主要困难在于依赖于训练数据中学过的类似题目来生成答案,而不是对问题本身的逻辑结构进行真正的理解和推理。
最高人民法院发布了“法信基座大模型”,这是国家级法律人工智能基础设施,也是法律行业的基座大模型。该模型经过海量、权威、高质量的法律大数据训练和增强训练,具备了强大的法律语言理解能力、法律文本信息抽取能力、法律逻辑推理能力以及根据提示文本生成能力。它能够理解公众非专业化的诉求表述,并提供专业水平的回答,为公众提供和解、调解、应诉等不同策略和建议,大大降低了公共法律服务的门槛。此外,该模型还能辅助法官快速进行信息分析比对,提高立案审查和阅卷效率。
欧盟发布《通用人工智能业务守则》初稿,明确AI风险管理指导方针
字节即梦AI视频生成模型更新,全量开放使用
字节跳动旗下即梦AI宣布两大视频模型正式全量上线,包括具有首帧一致性的S2.0Pro和具有极高提示词遵循能力P2.0Pro视频生成模型。S2.0Pro在图生视频场景下保持与用户输入图的一致性、色彩等细节还原,而P2.0Pro则能在一句提示词内实现多个镜头切换及多镜头组合,同时保持视频内形象主体、风格和氛围的一致性。
月之暗面创始人杨植麟:AI的下一个重要方向是“思考能力”
月之暗面Kimi创始人杨植麟在沟通会上透露,AI助手Kimi每月使用人数已达到3600万,且持续增长。杨植麟认为,AI发展的下一个重要方向是使其具备思考的能力,数学产品最适合让AI得到锻炼。最新数学模型k0-math将在教育场景应用,并用于提升Kimi搜索能力。杨植麟强调,月之暗面是主流大模型公司中人数最少但人效比最高的公司,公司将继续保持小而精的团队,以保持创新能力。