[AI日报·1/22]可灵AI推出多图参考功能,支持上传4张照片

每日必读

可灵AI推出多图参考功能,支持上传4张照片【AI视频/易用性突破】

可灵AI推出全新“多图参考”功能,用户可以上传1至4张参考图片,并框选特定元素来生成个性化的视频。这一功能提升了短片制作的视觉一致性,为创作者提供了更大的自由度。

谷歌升级Gemini 2.0 Flash Thinking,支持长上下文处理
谷歌于2025年1月22日正式发布了 Gemini 2.0 Flash Thinking 推理模型的增强版本。此次升级的核心亮点是支持高达 100万token 的长上下文处理能力,能够对长篇文本进行更深入的分析。此外,该模型还具备自我纠错功能,进一步提升了推理的可靠性和连贯性。谷歌AI负责人Jeff Dean表示,此次更新旨在减少模型思考过程与最终答案之间的矛盾。Gemini 2.0 Flash Thinking还继承了展示思考过程的特点,用户可以清晰看到模型的推理路径。

字节跳动发布豆包大模型1.5Pro灰度上线
2025年1月22日,字节跳动发布豆包大模型1.5版本。目前,已在豆包APP灰度上线,并可通过API调用。该版本采用大规模稀疏MoE架构,通过较小的激活参数进行预训练,等效于7倍激活参数的Dense模型性能。其在知识、代码、推理以及中文等多个测评基准上的表现全面超越GPT-4o等业界一流模型。此外,豆包1.5还推出了视觉理解模型和实时语音模型,进一步提升了多模态能力。

特朗普宣布成立5000亿美元“星际之门”AI项目

美国总统特朗普宣布了一项名为“星际之门”(Stargate)的AI基础设施投资计划。该项目由OpenAI、软银和甲骨文联合发起,初始投资1000亿美元,计划在未来四年扩展至5000亿美元。项目将从美国得克萨斯州的数据中心开始,预计创造10万个工作岗位。主要技术合作伙伴包括Arm、微软、英伟达等。

谷歌向Anthropic投资10亿美元,支持其发展

2025年1月22日,谷歌宣布向人工智能公司Anthropic追加投资10亿美元。此次投资旨在增强谷歌在人工智能领域的竞争力,进一步支持Anthropic的发展。Anthropic是OpenAI的主要竞争对手之一,谷歌此前已对其进行了多轮投资。

Mistral AI计划上市,拓展亚太市场

法国AI初创公司 Mistral AI 宣布计划上市,并在亚太地区开设办事处,首站设在新加坡。该公司以开源AI模型著称,其目标是通过上市进一步拓展市场,挑战OpenAI等竞争对手。Mistral AI曾在2024年完成6.4亿美元的B轮融资,估值达到64亿美元。该公司自成立以来增长迅猛,被视为欧洲AI产业的希望之星。

字节跳动计划2025年投入120亿美元研发AI芯片

据英国《金融时报》消息,字节跳动计划在2025年投入超过120亿美元用于AI芯片的研发。这笔资金将主要用于开发自主AI芯片,以满足其不断增长的算力需求。此外,字节跳动还计划在国内投入400亿元人民币用于AI基础设施建设。

网易有道开源子曰-o1推理模型,助力教育领域

2025年1月22日,网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”,并正式对外开源。该模型为14B轻量级单模型,采用思维链技术,支持在消费级显卡上部署,能够提供详细的解题过程和逻辑推理。其在教育领域的应用表现出色,已应用于有道旗下的“有道小P”产品,助力教育领域推理模型的广泛应用及创新。

商汤推出“秒画趣拍”APP,支持AI写真和视频

商汤科技于近期正式上线了全新APP“秒画趣拍”,旨在通过AI技术为用户提供创意影像体验。该应用支持用户上传照片后一键生成AI写真,并提供多种风格模板,如校园毕业照、名画风写真、二次元等。此外,“秒画趣拍”还支持视频创作功能,用户可以通过模板DIY功能制作个性化影像作品。

THE END
喜欢作者就支持一下吧~
点赞8 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情图片快捷回复

    暂无评论内容