[AI日报·1/16]AI视频精准控制角色动作；微软发布AutoGen v0.4，提升AI代理灵活性

加入交流群微信公众号图标

关注公众号联系我们图标

AI工具箱请求更新图标

体系设计

“锵锵！这里是心猿社滴杂务工之‘工具酱’！每日十分钟，最全的AI大事，全知道！”

“别开场了，省流日报，你每多说一个字，就浪费了心猿社辣么多用户整整二字节的流量！”

“嘿！到我这改了还？”

“导播导播，直接开场！”

技术突破（性能&易用性）

微软AutoGen v0.4发布，提升AI代理灵活性【自然语言·易用性突破】

2025年1月14日，微软发布了AutoGen v0.4版本，这是其AI代理编排框架的重大升级。新版本通过异步消息传递、模块化设计和跨语言支持，显著提升了AI代理的灵活性和可扩展性。AutoGen v0.4还引入了Magentic-One多代理框架，支持复杂任务自动化，包括网络浏览、文件管理和代码执行等功能。此外，AutoGen Studio低代码界面和调试工具的升级，进一步简化了AI代理的开发和管理。

Kinetix推出AI视频技术，精准控制角色动作【AI视频·易用性突破】

2025年1月16日，Kinetix推出了一项创新的AI视频技术，能够通过结合真人表演和文本指令，实现对数字角色动作的精准控制。用户无需专业动画制作经验，只需上传真实动作视频并配上文本描述，系统就能转化为数字角色的精准动作表现。该技术依托庞大的3D动画数据库和合成数据生成管道，可生成逼真的动作和表情，制作时间从传统数周缩短至数小时，大幅降低了成本，使中小型团队和个人创作者也能轻松创作专业动画。

AI重要事件&报道

阶跃星辰Step Reasoner mini上线，展现推理能力

阶跃星辰发布了其首个推理模型产品——Step Reasoner mini。该模型在包括AIME、Math在内的多项数学基准测试以及LiveCodeBench代码任务上的表现，均超越了OpenAI的o1-preview版本，展现出了强大的推理能力。新模型擅长主动进行规划、尝试和反思，能通过慢思考和反复验证的逻辑机制，为用户提供准确可靠的回复。而且，它既擅长通过超长推理能力，解决逻辑推理、代码和数学等复杂问题，也能兼顾文学创作等通用领域。

官网：https://yuewen.cn

阿里巴巴发布新型过程奖励模型，数学推理再进化

2025年1月16日，阿里巴巴Qwen团队发布了题为《数学推理中过程奖励模型的开发经验教训》的论文，并推出了Qwen2.5-Math-PRM系列中的两个新模型，分别具有7B和72B参数。这些模型利用创新技术克服了现有PRM框架中的限制，显著提升了推理的准确度和泛化能力，其在识别推理错误步骤能力上，7B的小尺寸超越了GPT-4o，同时团队还开源了首个步骤级的评估标准ProcessBench。

官网：https://yuewen.cn

Luma AI推出Ray2视频生成模型，提升创作效率

Luma AI在其Dream Machine生成AI视频创作平台上推出了Ray2视频生成模型。Ray2经过大量计算训练，提升了视频生成的速度和自然度，用户可以通过简单的文本描述生成短视频。不过，在复杂提示下可能出现失真，但整体反馈积极。为了庆祝这一发布，Luma Labs还举办了Ray2大奖赛，创作者们有机会赢得高达7000美元的奖金。

相关资讯：https://www.qewen.com/7103.html

官网：https://lumalabs.ai/ray

Vidu2.0上线，10秒生成短片，优化视频质量

生数科技发布了Vidu2.0，其单条512-4s图生视频的平均生成速度已跑进10秒，较1.0版本提升三倍。新版本不仅在速度上实现秒级飞跃，还优化了视频质量，保证了风格和主体的一致性，首尾过渡自然流畅。同时，Vidu2.0将单秒视频价格压低至0.04475元，远低于行业均价，其720p每秒单价仅为行业均价的43%，商业短视频广告生成成本大幅降低。

官网：https://grok.com/coming-soon

xAI上线Grok网页版，无需X账号体验

埃隆·马斯克旗下的xAI公司继推出iOS版Grok AI聊天机器人后，又上线了网页版Grok AI聊天机器人。用户无需访问X.com平台，甚至无需拥有X账户，即可通过访问grok.com体验Grok AI的强大功能，包括实时信息收集、问题解答和图像生成等。

官网：https://grok.com/coming-soon

AI发烧友&Github资讯

适合开发者/程序员等喜欢探索AI的用户哦~

智谱发布GLM-4-Air、GLM-4V-Plus及Flash全模态免费模型

智谱华章科技公司发布了GLM-4-Air和GLM-4V-Plus模型，并推出了全新端到端模型GLM-Realtime，实现低延迟的视频理解和语音交互。同时，智谱还设立了Flash全模态免费模型，支持多种应用场景，助力开发者创新。

鉴定网络热门AI事件（陪我一起看资讯吧~）

智谱AI回应被列入美国实体清单

2025年1月15日，美国商务部工业和安全局（BIS）将中国大模型企业智谱AI及其子公司列入实体清单，理由是智谱通过开发和整合先进的人工智能研究，推进了中国的军事现代化。这是中国大模型企业首次被列入美方实体清单。智谱AI对此回应称，这一决定缺乏事实依据，并表示强烈反对。智谱强调，公司掌握全链路大模型核心技术，被列入实体清单不会对业务产生实质影响。同时，智谱发布了一系列新模型，包括GLM-Realtime、GLM-4-Air和GLM-4V-Plus，以展示其技术实力。

Astral公司用AI在Reddit刷推广帖引发担忧

Astral公司利用AI技术在Reddit上大量发布广告，其创始人萨瓦娜·费德展示了这项技术的快速应用能力，能够在短时间内生成与用户讨论相似的内容，从而悄然推销客户的产品。这种做法引发了人们对网络内容未来的担忧，可能导致社交媒体充斥无休止的广告与垃圾信息。

相关资讯：https://www.qewen.com/7089.html

MangaNinja线稿上色技术，精准匹配参考图

MangaNinja是一种基于参考图像的线稿上色技术，通过创新的补丁重排模块和点驱动控制方案，实现了高精度的颜色匹配和细节转录。该技术能够处理复杂场景，如极端姿势和多参考图像的协调，显著提升了上色的准确性和图像质量。MangaNinja适用于漫画创作、插画设计和数字艺术等领域，为用户提供了高质量的互动上色体验。

相关资讯：https://www.qewen.com/7106.html

项目地址：https://github.com/ali-vilab/MangaNinjia

腾讯会议升级，AI小助手Pro上线

2025年1月15日，腾讯会议宣布产品升级，正式推出AI小助手Pro。该助手基于腾讯混元大模型，不仅能帮助用户高效管理会议安排，还通过实时语音识别和自然语言处理，提供智能化的会议记录和要点提炼功能。此外，新版本在组织协作方面也显著增强，支持团队成员流畅的通讯录管理，所有用户都能在腾讯会议中创建组织，还支持用户对外展示认证身份，提升了线上沟通的信任度。

THE END