July 12, 2025
非 CoT 版本,但已通过合成工具数据和 RL 内化了 Agentic 能力,MuonClip 优化器亮眼
July 11, 2025
METR 以每小时 $150 的价格,找了 16 位有经验的开源项目开发者,用 Cursor(Claude 3.5/3.7)做实验对比,发现 AI 反而拖慢了开发速度。后有参与者反馈,觉得实验本身可能还有很多不完善的地方,加上近半年 coding agents 发展飞速,现在再做可能会有不一样的结论。
July 10, 2025
抛开质量,只从成本、特性和技术指标来全面比较视频模型
July 8, 2025
用“能量模型”来实现通用慢思考
July 1, 2025
文心4.5如期开源,5款(带base版共10款)不同尺寸、模态和推理,采用Apache协议开源 时间线: 2月中,官宣要推出4.5系列并于6月底开源 3月中,一言App上线4.5和X1 4月下,一言App上线4.5-turbo和X1-turbo 根据百度云一些信息,此次开源的为turbo版本,是旗舰吗?
June 30, 2025
会讲 北京/上海/四川 三种方言