腾讯发布首个专为近距离人机交互感知的视觉语言模型TAIHRI,突破传统全身重建范式,实现任务相关身体部位的精确度量级3D空间定位。该模型通过将3D关键点量化为有限交互空间,结合2D关键点推理与下一token预测机制,在自我中心相机坐标系下精准定位关键身体部位。实验表明,TAIHRI在任务关键身体部位估计精度上显著优于传统方法,并支持自然语言控制与全局人体网格重建等下游任务,相关代码已开源。
研究团队推出SPASM框架,通过模块化设计解决多轮对话中智能体的人设漂移与"回声"问题。该框架包含人设创建、对话生成与终止检测模块,核心创新Egocentric Context Projection(ECP)技术将对话历史存储为视角无关表示,再投影至各智能体自我中心视角,在不改变模型权重的前提下提升长程稳定性。基于GPT-4o-mini、DeepSeek-V3.2和Qwen-Plus构建的数据集包含4,500个人设与45,000段对话,实验证实ECP显著抑制人设漂移并消除回声现象。
介绍如何运用 ChatGPT 开展头脑风暴,梳理思路并将模糊概念转化为结构化、可执行的行动方案,提升创意整理效率。
通过 custom instructions 和 memory 功能,让 ChatGPT 提供更相关、一致且量身定制的回答。
了解如何在 ChatGPT 中上传 PDF、电子表格等文件,利用该功能分析数据、总结文档,并基于文件内容生成新内容。
介绍 OpenAI 旗下 ChatGPT、Codex 及 API 等产品在真实场景中的应用,涵盖工作、开发与日常任务等实际用例。
销售团队可利用 ChatGPT 完成客户调研、个性化外联、交易全流程管理及销售漏斗优化,有效提升线索转化与成交效率。
专为金融服务业打造的AI资源合集,涵盖提示词包、GPT模型、实用指南及专业工具,助力金融机构安全、高效地部署和扩展人工智能应用,推动行业智能化升级与数字化转型。
文章是一份面向初学者的清晰指南,旨在解释人工智能的基本概念与工作原理。它阐述了什么是人工智能,并重点说明了以ChatGPT为代表的工具如何利用大型语言模型(LLM)来运作。内容涵盖了AI的核心定义、运作机制,以及具体工具的应用方式,为读者理解这一技术提供了基础框架。
财务团队可利用 ChatGPT 简化报告编制、分析财务数据、改进预测准确性,并更清晰地向管理层传达业务洞察,提升整体财务管理效率。
新手指南:介绍 ChatGPT 的基础使用方法,包括如何开启首次对话,以及利用 AI 进行写作、头脑风暴和解决问题的实用技巧。
介绍管理者如何利用 ChatGPT 准备重要对话、撰写清晰反馈、保持工作条理并提升团队效率,涵盖具体使用场景与实操方法。
临床医生使用符合 HIPAA 标准的 ChatGPT 辅助诊断、病历记录和患者护理,探索安全合规的 AI 医疗工具在临床工作中的应用场景。
提供使用 ChatGPT 等 AI 工具的最佳实践指南,聚焦安全性、准确性与透明度,指导用户如何负责任地部署和应用生成式 AI。
面向运营团队的 ChatGPT 应用指南,介绍如何利用 AI 工具简化工作流程、提升团队协作效率、标准化操作规范并加速业务执行。涵盖从流程优化到跨部门协调的具体实践方法。
OpenAI 推出 ChatGPT Skills 功能,支持用户创建可复用的技能模块以构建标准化工作流。该功能可自动化处理重复性任务,确保输出结果的一致性与高质量,适用于需要批量处理或固定流程的场景。通过自定义技能,用户能够减少重复操作,提升工作效率,实现更灵活的 AI 应用部署。
本文介绍如何构建和使用自定义 GPTs,实现工作流自动化、维持输出一致性,并创建专用 AI 助手,帮助用户打造适合特定业务需求的智能工具,提升工作效率。
OpenAI 回应 Axios 供应链攻击事件,已轮换 macOS 代码签名证书、更新应用程序,并确认用户数据未遭泄露。
营销团队使用 ChatGPT 规划营销活动、生成内容并分析数据表现,缩短从创意到执行的周期,提升 campaign 落地效率。
ChatGPT 新增 Projects 功能,支持按项目组织聊天记录、上传文件和设置自定义指令,帮助用户管理长期工作流并提升协作效率。
Claude Code v2.1.98 发布,新增 Google Vertex AI 交互式设置向导、Perforce 版本控制支持(CLAUDE_CODE_PERFORCE_MODE)及 Linux 子进程沙盒功能(PID 命名空间隔离)。修复多项 Bash 工具安全漏洞,包括权限绕过、复合命令绕过强制提示、/dev/tcp 重定向自动授权等问题。权限管理支持 additionalDirectories 实时生效,同时优化 MCP OAuth 刷新、流式响应超时及后台代理进度报告等体验细节。
针对 Anthropic 发布的 Claude Mythos 公告,文章认为市场反应过度,目前无需恐慌。尽管该公告可能涉及重大技术更新或新功能发布,但作者指出相关炒作存在夸大成分,建议保持冷静观察,避免对未经验证的性能指标或技术突破产生过度期待。
LMSYS Org推出HiSparse分层内存系统,针对稀疏注意力仍受限于GPU内存容量的问题,将非活跃KV缓存卸载至主机内存,仅在GPU HBM保留热缓冲区,并通过专用CUDA内核高效管理数据交换(采用LRU策略与页表更新)。该系统在256并发请求下实现超3倍吞吐量提升,GLM-5.1-FP8模型长上下文场景性能提升达5倍,支持DeepSeek-V3.2等采用DeepSeek Sparse Attention架构的模型。
Runway 扩大与 NYU Tisch 艺术学院合作,向 ITP、IMA 及 Hyper Cinema Lab 学生开放全套 AI 工具,支持课程作业与个人创作。Runway 创始团队曾就读于 ITP,此次合作旨在让新一代创作者掌握 AI 时代的电影与艺术工作流。
本文提出首个面向3D具身智能体的推理时视觉对比解码框架3D-VCD,用于缓解多模态大模型在三维环境中的幻觉问题。该方法通过对物体类别、空间坐标及几何范围施加语义与几何扰动构建扭曲的3D场景图,通过对比原始与扭曲场景的预测差异,抑制受语言先验驱动而非场景证据支持的不可靠token。在3D-POPE和HEAL基准测试中,该方法无需重新训练即显著提升了具身智能体的基础推理能力。
研究团队提出一种元优化的fMRI语义视觉解码方法,通过上下文学习实现免训练的跨受试者泛化。该方法仅需少量图像-脑激活样本作为条件,即可快速推断新受试者的独特神经编码模式,并采用分层反演策略完成解码。实验表明,无需重新训练、微调、解剖对齐或刺激重叠,即可在多种视觉主干网络上实现强跨受试者和跨扫描仪泛化能力,为构建非侵入式脑解码通用基础模型奠定关键基础。
研究者提出隐性课程假设,指出预训练遵循可组合且可预测的课程结构。通过设计涵盖检索、形态转换、逻辑推理和数学等领域的组合任务,对410M至13B参数的四个模型家族进行追踪,发现技能涌现顺序跨模型高度一致(ρ=.81),且复合任务通常在其组件任务之后出现。研究表明该结构编码于模型内部表征中,利用任务表征空间可有效预测未见过组合任务的训练轨迹(R²=.68-.84),揭示预训练过程比损失曲线显示的更具结构性。
ReconPhys 是首个可从单目视频联合重建几何、外观与物理属性的前馈框架。该方法采用双分支架构与自监督训练策略,无需真实物理标签即可实现端到端推理。在合成数据集测试中,其未来预测 PSNR 达到 21.64,显著优于现有优化基线的 13.27;Chamfer Distance 从 0.349 降至 0.004。关键突破在于推理速度:仅需不到 1 秒即可完成重建,而传统方法需耗时数小时,为机器人与图形学领域快速生成仿真就绪资产提供了新方案。
针对大语言模型后训练必须使用新鲜 on-policy 数据的传统观点,研究系统探讨了经验回放技术的应用。通过形式化分析 replay buffer 设计在数据陈旧性方差、样本多样性与生成计算成本间的权衡,发现当生成成本高昂时,严格的 on-policy 采样实为次优选择。实证表明,设计良好的 replay buffer 可在保持策略熵的同时,大幅减少推理计算,且不损害甚至提升最终模型性能。
Uni-ViGU框架通过扩展扩散式视频生成器统一视频生成与理解,反转了传统以理解为中心的多模态模型范式。该框架采用统一流方法,在单一过程中对视频进行连续流匹配、对文本进行离散流匹配;引入模态驱动的MoE架构,以轻量级层增强Transformer实现文本生成;并通过双向训练机制(知识召回与能力细化两阶段)将生成知识迁移至理解任务。实验表明,该模型在视频生成与理解任务上均达到竞争性性能,验证了以生成为中心的架构路径可行性。
CyberAgent 部署 ChatGPT Enterprise 与 Codex,在广告、媒体及游戏业务中安全扩展 AI 应用,提升工作质量并加速决策流程,实现业务全面提速。
Claude Code v2.1.97 版本发布,为 NO_FLICKER 模式新增焦点视图切换(Ctrl+O)及多项渲染修复。权限系统修复了 Bash 工具环境变量检查、MCP HTTP 连接内存累积(约 50MB/小时)、429 重试逻辑及设置热重载等漏洞。新增状态栏自动刷新、git worktree 检测、agents 运行指示器及 Cedar 策略文件语法高亮。改进包括自动批准安全环境变量前缀的文件命令、CJK 输入无需空格即可触发补全,以及图像压缩统一处理。
Anthropic 发布了一份关于 Mythos 的新报告,其潜在影响令人担忧。尽管目前可验证的具体事实细节尚不充分,文章建议保持冷静思考,提供了理性评估该报告的出发点,呼吁在获得更多实证信息前避免过度反应,基于现有线索进行审慎分析。