[AI日报·1/16]AI视频精准控制角色动作;微软发布AutoGen v0.4,提升AI代理灵活性

“锵锵!这里是心猿社滴杂务工之‘工具酱’!每日十分钟,最全的AI大事,全知道!”

“别开场了,省流日报,你每多说一个字,就浪费了心猿社辣么多用户整整二字节的流量!”

“嘿!到我这改了还?”

“导播导播,直接开场!”


技术突破(性能&易用性)

微软AutoGen v0.4发布,提升AI代理灵活性【自然语言·易用性突破】

2025年1月14日,微软发布了AutoGen v0.4版本,这是其AI代理编排框架的重大升级。新版本通过异步消息传递、模块化设计和跨语言支持,显著提升了AI代理的灵活性和可扩展性。AutoGen v0.4还引入了Magentic-One多代理框架,支持复杂任务自动化,包括网络浏览、文件管理和代码执行等功能。此外,AutoGen Studio低代码界面和调试工具的升级,进一步简化了AI代理的开发和管理。

相关资讯:https://guid.cam/tech/laurine/2025/01/14/microsoft-releases-autogen-0-4-with-magentic-one-multi-ai-agent-framework-xcxwbn/

Kinetix推出AI视频技术,精准控制角色动作【AI视频·易用性突破】

2025年1月16日,Kinetix推出了一项创新的AI视频技术,能够通过结合真人表演和文本指令,实现对数字角色动作的精准控制。用户无需专业动画制作经验,只需上传真实动作视频并配上文本描述,系统就能转化为数字角色的精准动作表现。该技术依托庞大的3D动画数据库和合成数据生成管道,可生成逼真的动作和表情,制作时间从传统数周缩短至数小时,大幅降低了成本,使中小型团队和个人创作者也能轻松创作专业动画。

相关资讯:https://www.chinaz.com/ainews/14762.shtml


AI重要事件&报道

阶跃星辰Step Reasoner mini上线,展现推理能力

阶跃星辰发布了其首个推理模型产品——Step Reasoner mini。该模型在包括AIME、Math在内的多项数学基准测试以及LiveCodeBench代码任务上的表现,均超越了OpenAI的o1-preview版本,展现出了强大的推理能力。新模型擅长主动进行规划、尝试和反思,能通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。而且,它既擅长通过超长推理能力,解决逻辑推理、代码和数学等复杂问题,也能兼顾文学创作等通用领域。

相关资讯:https://www.jiqizhixin.com/articles/2025-01-16-9

官网:https://yuewen.cn

阿里巴巴发布新型过程奖励模型,数学推理再进化

2025年1月16日,阿里巴巴Qwen团队发布了题为《数学推理中过程奖励模型的开发经验教训》的论文,并推出了Qwen2.5-Math-PRM系列中的两个新模型,分别具有7B和72B参数。这些模型利用创新技术克服了现有PRM框架中的限制,显著提升了推理的准确度和泛化能力,其在识别推理错误步骤能力上,7B的小尺寸超越了GPT-4o,同时团队还开源了首个步骤级的评估标准ProcessBench。

相关资讯:http://www.citnews.com.cn/news/202501/193116.html

官网:https://yuewen.cn

Luma AI推出Ray2视频生成模型,提升创作效率

Luma AI在其Dream Machine生成AI视频创作平台上推出了Ray2视频生成模型。Ray2经过大量计算训练,提升了视频生成的速度和自然度,用户可以通过简单的文本描述生成短视频。不过,在复杂提示下可能出现失真,但整体反馈积极。为了庆祝这一发布,Luma Labs还举办了Ray2大奖赛,创作者们有机会赢得高达7000美元的奖金。

相关资讯:https://www.qewen.com/7103.html

官网:https://lumalabs.ai/ray

Vidu2.0上线,10秒生成短片,优化视频质量

生数科技发布了Vidu2.0,其单条512-4s图生视频的平均生成速度已跑进10秒,较1.0版本提升三倍。新版本不仅在速度上实现秒级飞跃,还优化了视频质量,保证了风格和主体的一致性,首尾过渡自然流畅。同时,Vidu2.0将单秒视频价格压低至0.04475元,远低于行业均价,其720p每秒单价仅为行业均价的43%,商业短视频广告生成成本大幅降低。

相关资讯:https://36kr.com/p/3123925668731139

官网:https://grok.com/coming-soon

xAI上线Grok网页版,无需X账号体验

埃隆·马斯克旗下的xAI公司继推出iOS版Grok AI聊天机器人后,又上线了网页版Grok AI聊天机器人。用户无需访问X.com平台,甚至无需拥有X账户,即可通过访问grok.com体验Grok AI的强大功能,包括实时信息收集、问题解答和图像生成等。

相关资讯:https://news.qq.com/rain/a/20250116A01HIH00

官网:https://grok.com/coming-soon


AI发烧友&Github资讯

适合开发者/程序员等喜欢探索AI的用户哦~

智谱发布GLM-4-Air、GLM-4V-Plus及Flash全模态免费模型

智谱华章科技公司发布了GLM-4-Air和GLM-4V-Plus模型,并推出了全新端到端模型GLM-Realtime,实现低延迟的视频理解和语音交互。同时,智谱还设立了Flash全模态免费模型,支持多种应用场景,助力开发者创新。

相关资讯:https://www.bilibili.com/opus/1022946113390379024


鉴定网络热门AI事件(陪我一起看资讯吧~)

智谱AI回应被列入美国实体清单

2025年1月15日,美国商务部工业和安全局(BIS)将中国大模型企业智谱AI及其子公司列入实体清单,理由是智谱通过开发和整合先进的人工智能研究,推进了中国的军事现代化。这是中国大模型企业首次被列入美方实体清单。智谱AI对此回应称,这一决定缺乏事实依据,并表示强烈反对。智谱强调,公司掌握全链路大模型核心技术,被列入实体清单不会对业务产生实质影响。同时,智谱发布了一系列新模型,包括GLM-Realtime、GLM-4-Air和GLM-4V-Plus,以展示其技术实力。

相关资讯:https://www.sohu.com/a/849770946_122014422

Astral公司用AI在Reddit刷推广帖引发担忧

Astral公司利用AI技术在Reddit上大量发布广告,其创始人萨瓦娜·费德展示了这项技术的快速应用能力,能够在短时间内生成与用户讨论相似的内容,从而悄然推销客户的产品。这种做法引发了人们对网络内容未来的担忧,可能导致社交媒体充斥无休止的广告与垃圾信息。

相关资讯:https://www.qewen.com/7089.html

MangaNinja线稿上色技术,精准匹配参考图

MangaNinja是一种基于参考图像的线稿上色技术,通过创新的补丁重排模块和点驱动控制方案,实现了高精度的颜色匹配和细节转录。该技术能够处理复杂场景,如极端姿势和多参考图像的协调,显著提升了上色的准确性和图像质量。MangaNinja适用于漫画创作、插画设计和数字艺术等领域,为用户提供了高质量的互动上色体验。

相关资讯:https://www.qewen.com/7106.html

项目地址:https://github.com/ali-vilab/MangaNinjia

腾讯会议升级,AI小助手Pro上线

2025年1月15日,腾讯会议宣布产品升级,正式推出AI小助手Pro。该助手基于腾讯混元大模型,不仅能帮助用户高效管理会议安排,还通过实时语音识别和自然语言处理,提供智能化的会议记录和要点提炼功能。此外,新版本在组织协作方面也显著增强,支持团队成员流畅的通讯录管理,所有用户都能在腾讯会议中创建组织,还支持用户对外展示认证身份,提升了线上沟通的信任度。

相关资讯:https://news.qq.com/rain/a/20250115A08PPK00

THE END
喜欢作者就支持一下吧~
点赞10 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情图片快捷回复

    暂无评论内容