[AI日报·1/24]OpenAI发布首个AI智能体Operator,可控制电脑

每日必读

OpenAI发布首个AI智能体Operator,可控制电脑【AI助理/性能突破】

OpenAI于2025年1月23日发布了其首款AI智能体Operator。Operator能够像人类一样使用浏览器,独立完成各种在线任务,如预订机票、酒店、购买杂货等。该智能体目前以“研究预览版”形式在美国上线,首批面向ChatGPT Pro用户,未来将逐步推广到其他版本。Operator背后的核心技术是CUA模型,结合了GPT-4o的视觉功能与高级推理能力。OpenAI还与多家科技公司合作,确保Operator在这些应用中顺畅运行。

HeyGen推出数字人运动控制功能:能弹乐器还能跳舞【AI视频/性能&易用性突破】

HeyGen发布了数字人运动控制功能,实现了虚拟形象的复杂肢体动作操控。该技术突破使得数字人不仅能够完成基础的微表情,还能流畅地执行弹奏乐器和舞蹈表演等复杂动作,动作响应延迟降低至12毫秒,极大提升了视频制作效率。

Perplexity推出Android移动助手:可写电子邮件、预订晚餐【AI助理/性能突破】

Perplexity于2025年1月24日推出了一款名为Perplexity Assistant的Android移动助手。该助手具备多模态交互能力,能够回答问题、撰写邮件、设置提醒、预订晚餐等。它还可以通过摄像头识别物品或场景,并支持与Spotify、YouTube、Uber等应用的交互。目前,该助手仅支持Android平台,未来可能会扩展到其他平台。

元象推出智能数字人平台「元象日播」

元象信息科技有限公司于2025年1月24日推出了智能数字人平台「元象日播」。该平台具备高自然度定制能力实时交互功能一键开播特性,能够快速搭建专业直播空间,并通过自研大模型实现观众互动。平台支持音色克隆和全头全脸驱动技术,用户可上传少量音频素材实现高度定制化的数字人形象。此外,平台还支持将直播内容一键推流至美团、抖音、淘宝等主流平台。目前,元象日播已广泛应用于本地生活团购、娱乐、餐饮、医疗等行业,显著提升了客户的销售转化率。

百川智能发布全场景深度思考模型Baichuan-M1-preview

百川智能发布了全场景深度思考模型Baichuan-M1-preview,该模型同时具备语言、视觉和搜索三大领域推理能力。它在数学、代码等多个权威评测中的表现可对标o1-preview,并解锁了“医疗循证模式”,能够快速、精准地回答医疗临床和科研问题。此外,百川智能还推出了行业首个开源医疗增强大模型Baichuan-M1-14B。

Hugging Face推SmolVLM模型:小巧智能,手机也能跑【需魔法

Hugging Face推出了一款名为SmolVLM的轻量级视觉语言模型。该模型体积小巧,仅需20亿参数,即可在手机等小型设备上运行,同时性能超越了需要大型数据中心支持的前辈模型。SmolVLM的推出标志着AI技术在设备端推理的新突破,降低了企业的计算成本,推动了AI应用的普及。

中国联通发布元景思维链大模型:性能超越GPT-4

中国联通于1月18日发布了元景思维链大模型,这是央企首个开源的通用思维链大模型。该模型具备强大的“慢思考”能力和多场景推理能力,能够在不同任务和难度下自适应调整。在主流榜单测评中,其性能超越了OpenAI的GPT-4。


鉴定网络热门AI事件

一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

国外软件工程师安纳奈·阿罗拉以极低价格购买了OGOpenAI.com域名,并将其重定向至中国AI实验室DeepSeek。DeepSeek的AI模型在某些基准测试中表现优于OpenAI的o1模型,而OpenAI则因未能及时发布强大模型而受到行业批评。

OpenAI CEO宣布ChatGPT免费版将引入o3-mini,效率翻倍

OpenAI首席执行官Sam Altman宣布,ChatGPT的免费版将升级为全新的o3-mini模型,旨在提升用户体验并满足日常需求。该模型将为免费用户提供更快的响应速度,同时付费用户将获得更多使用机会。

THE END
喜欢作者就支持一下吧~
点赞11 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情图片快捷回复

    暂无评论内容