输入脚本秒生视频 字节开源StoryMem解决AI角色变脸问题
字节跳动与南洋理工大学联合开源StoryMem框架,通过创新的视觉记忆机制,将单镜头视频扩散模型转化为多镜头长视频故事讲述者。该框架能根据分镜脚本自动生成超过1分钟、角色与场景高度连贯的叙事视频,有效解决AI视频生成中的角色“变脸”和场景跳变问题,适用于广告、影视预制作和短视频创作等领域。
马斯克脑机接口获突破 万人排队接受植入手术
马斯克的Neuralink在脑机接口技术上取得重大突破,单根电极植入时间缩短至1.5秒,植入深度突破50毫米,成本大幅降低。目前已有超万人排队等待植入,技术不仅帮助瘫痪患者重获生活能力,更指向意识数字化和跨星球文明存续的终极愿景。文章深入解析了手术机器人的核心技术壁垒及现实应用场景。
机器人治疗自闭症效果显著 临床试验132名儿童验证眼神微笑优势
最新发表在《Science Robotics》的研究通过两项随机对照试验,首次提供了机器人辅助治疗自闭症的高质量临床证据。研究发现,机器人治疗师在提升自闭症儿童核心社交技能方面与传统疗法效果相当,同时能显著增加孩子的眼神注视时间和自发微笑频率,有效解决传统疗法中孩子容易失去兴趣的瓶颈问题。
37℃体温机器人将众筹,拟成为你的第四种关系
Eva.i是一款拥有37℃恒定体温的AI伴侣机器人,通过仿生皮肤和石墨烯温控系统实现真实触感交互。它具备多模态互动能力,旨在成为介于人、宠物和物品之间的'第四种关系',提供无负担的情感陪伴。机器人适用于都市生活、老年人陪伴、高端接待等多个场景,计划于2025年底开启众筹。
华南理工团队模仿染色体研发可编程高负载人造肌肉
华南理工大学周奕彤课题组受染色体多层次螺旋折叠结构启发,在单根聚合物纤维中实现了可编程的多级螺旋结构,成功突破了人造肌肉中‘大变形’与‘高负载’不可兼得的经典困境。该研究发表在《ACS Applied Materials & Interfaces》上,展示了新型人造肌肉高达88.1%的收缩率、9倍的负载提升以及860.7%的惊人伸长率,为软体机器人驱动提供了创新解决方案。
视频AI应用几分钟即可搭建 开源框架VideoPipe简化CV开发
VideoPipe是一款开源视频分析框架,通过创新的管道架构让开发者像搭积木一样快速构建视频AI应用。它支持多源视频流输入、多样化推理引擎,并覆盖从拉流到推流的完整处理链路,极大降低了计算机视觉应用的开发门槛和落地周期。
2025全球具身智能机器人前沿技术与产业生态合作大会圆满举行
2025年12月27日,珞石机器人主办的全球具身智能机器人大会成功举办。大会以“具身跃迁•生态共荣”为主题,汇聚全球顶尖专家与产业领袖,围绕技术突破、场景落地与生态共建展开深度研讨。会议探讨了从感知智能到具身智能的技术演进、长程灵巧操作、多模态应用等前沿方向,旨在推动产业链协同,加速机器人从“执行工具”向“智能伙伴”的跨越,赋能千行百业,共筑智能制造未来。
智谱GLM-4.7编程大赛夺冠,引领开源AI新方向
智谱GLM-4.7模型在WebDev编程榜单上超越GPT-5.2,成为开源大模型第一,被誉为Claude Code最佳平替。文章详细介绍了其技术优势,包括后训练优化、多语言编码支持及在消费级显卡上的高效运行,同时宣布开源Slime框架,展现了国产AI模型的国际竞争力。
马斯克批评政府医疗体系,称Grok与Optimus将取代全民医保
埃隆·马斯克针对政府医疗体系效率问题,提出由Grok AI进行智能诊断、Optimus机器人执行手术的颠覆性医疗方案,旨在打造高效普惠的“技术乌托邦”。文章探讨了这一愿景的技术基础、潜在价值及面临的现实挑战,揭示了AI与机器人技术对未来社会结构的深远影响。
Meta AI发布Pixio图像模型,以像素重建技术突破3D重建新纪录
Meta AI推出的Pixio图像模型通过改进MAE框架,采用大面积连续遮罩和增强解码器,迫使模型深入理解图像的空间关系。该模型以6.31亿参数超越更复杂的DINOv3,在单目深度估计和3D重建任务中刷新纪录,证明了简单训练路径在视觉任务中的卓越性能。