AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
今天7月3日 周五
01:22AYi60Firefox 内置免费 VPN,Claude Fable 5 在 ZenMux 上限时免费回归
01:21Simon Willison 博客54Geoffrey Litt 在 AIE 提出「理解以参与」理念:与编码智能体协作需避免认知债务
01:08SemiAnalysis45电力缺口迫使AI数据中心自建供电
01:04Ethan Mollick49Claude Code的Fable功能强大但不适合长自主任务
01:04Ethan Mollick52持续学习是AI最大障碍,EBR-bench无改进
01:04jason15Codex用屏幕镜像控制iPhone查附近人发短信
00:59Chubby♨️29Anthropic Fable 5 遭严重削弱因护栏
00:45The Decoder:AI News(RSS)50Anthropic 为 Claude Code 削减 80% 系统提示词,称 Fable 5 模型"想要更短的提示词"
00:33Berryxia.AI13被窝里远程指挥Claude Fable 5干活
00:33Emad23OpenAI与Anthropic应各捐10%股权予美国儿童
00:29Chubby♨️43Kim 介绍用 Bloome 实现多 AI 智能体群聊协作
00:14Hacker News 热门(buzzing.cc 中文翻译)60CursorBench 3.1
00:09elvis35构建LLM验证器和裁判成高需求技能
00:09elvis36Fable 5早期兴奋消退,失望情绪蔓延
00:06IT之家(RSS)54何小鹏:中国智能辅助驾驶领先全球,未来3-5年可见L4甚至L5落地
7月2日周四
23:59Chubby♨️25用户仍在等待Gemini 3.5 Pro发布
23:39Deedy562020 年以来按网站流量排名的前 20 家初创公司
23:30数字生命卡兹克63Claude fable 5 自主提交工单交流
23:14Hacker News 热门(buzzing.cc 中文翻译)66The Editorial 发稿称 AI 取代记者致 47 家周报倒闭,事后证实为 AI 假新闻
23:06IT之家(RSS)38华为:乾崑智驾 ADS 4 升级至 ADS 5 不存在硬件限制
23:03Ethan Mollick50Ethan Mollick:你真的需要自己的基准测试
22:39elvis61AI主权不可选择:Palantir CEO强调控制权与开源模型关键地位
22:30fofr42与Agent对话压缩意图学会Claudish
22:29Chubby♨️23GPT-5.6 安全护栏会与 Fable 5 一样严吗?
22:21AYi54Claude Code+Sonnet 5 十八分钟做出获奖级网站
22:09meng shao52三次LLM交互范式:从网页聊天到组织内嵌式AI
21:14Hacker News 热门(buzzing.cc 中文翻译)57"定理经济"的衰落
20:45The Decoder:AI News(RSS)71精选Fable 5 在 RLI 基准中达成 16.1% 自动化率,较八个月前提升六倍
20:34TechCrunch:AI(RSS)58用户利用开源AI智能体OpenClaw结合Claude自动生成约会视频,引发隐私争议
20:21AYi53Claude Fable 5在ZenMux回归并限时免费,用户分享高质量人像提示词方法论
20:06IT之家(RSS)38联想高管:从长期看,算力没有过剩
19:39meng shao79精选browser-use 发布开源 AI 视频剪辑 Skill「video-use」
19:29eric zakariasson66Fable 在 Cursor 中的两种高效用法
19:29fofr60Omni 图像参考一镜到底示例
19:29Chubby♨️60OpenAI提议向美国政府提供5%股份的真实动机
18:59向阳乔木56Computer Use 自动订阅 YouTube 播客体验
18:31公众号:千问APP(阿里)62精选千问团队朱达:C端Agent Harness的"多快好省"工程哲学与主动服务探索
18:21AYi61AI是放大器而非核心发动机,个人判断力与执行力才是护城河;营销Agent Lev8 数据亮眼
18:20公众号:卡尔的AI沃茨61实测腾讯Marvis:手机远程操控Mac清出100GB,还能续写小说
18:09Alibaba Cloud35Flink Forward Asia 2026:阿里云等提出Agent时代统一愿景
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
01:22
AYi@AYi_AInotes
60
Firefox 内置免费 VPN,Claude Fable 5 在 ZenMux 上限时免费回归

Firefox 推出官方原生 IP 保护功能,内置免费 VPN,每月赠送 50G 流量。开启方法:地址栏输入 about:config → 显示全部首选项 → 搜索 browser.ipProtection.enabled → 切换为 true。Claude Fable 5 回归上线,ZenMux 上限时免费使用。Fable 5 可输出高质量人像提示词,通过拆解塑料感根源、8 维度框架及自我检查环节,系统性避免塑料皮肤、畸形手等问题。ZenMux 提供无 RPM 限制、同屏 PK 功能,支持 Fable5、GPT-5.5、Opus4.8 等多模型对比,自动充值每笔返 20% 余额。

AYi: Claude Fable 5今天回归上线啦,ZenMux上限时免费使用真的太香了! 怎么用Fable 5输出高质量的「不会塑料 + 顶级人像提示词方法论以及户外美女人像prompt方法论大家收好! 说真的,我以为上次的Fable 5总结的A...

开源生态教程/实践
01:21
Simon Willison 博客
54
Geoffrey Litt 在 AIE 提出「理解以参与」理念:与编码智能体协作需避免认知债务

Geoffrey Litt 在 AIE 演讲中提出「理解以参与」理念:开发者需要深入理解代码,才能在与编码智能体(coding agents)的协作中保持主动参与,避免因认知债务(cognitive debt)导致无法有效推进项目。他认为,缺乏对代码的概念流畅性会显著限制参与能力。该演讲录像将于三周内陆续放出。

智能体大佬观点编码
01:08
SemiAnalysis@SemiAnalysis_
45
太阳能和储能每年各新增超过20GW。听起来新增大量电力。但电网在需求高峰时实际能依赖的容量几乎没有变化。这一缺口正是AI数据中心开始自建电力容量,而非排队等待接入电网的原因。(1/3)🧵
现象/趋势部署/工程
01:04
Ethan Mollick@emollick
49
Fable in Claude Code 确实能做到非常惊人的事情,包括非程序员也可以用,但界面并不是为管理5小时以上的自主任务而设计的。很难实时观察发生了什么并干预,你经常必须等到输出。
智能体Anthropic大佬观点编码
01:04
Ethan Mollick@emollick
52
Ethan Mollick指出,持续学习是AI爆炸式采用的最大障碍,并对递归自我改进有重大影响。只要模型健忘、需人类替其学习,采用速度就受限于人类流程。EpochAI Research为此推出EBR-bench,通过让AI反复玩Earthborne Rangers棋盘游戏来测试其即时学习能力。初步结果显示:AI未能从错误中改进,至今无提升迹象。

Epoch AI: Introducing EBR-bench, our new benchmark to measure on-the-fly learning. AI repeatedly plays a challenging board game ca...

大佬观点推理现象/趋势
01:04
jason@jxnlco
15
即将使用 codex computer use 通过屏幕镜像控制我的 iPhone,查看 Find My 了解周围有谁并给他们发短信。
智能体OpenAI其他编码
00:59
Chubby♨️@kimmonismus
29
Fable 5 不是被削弱,而是被屠杀了。问题甚至不在于模型本身,而在于 Anthropic 设置的硬性护栏。网友对此表示震惊。

ħεsam: Fable 5 isn't nerfed, it's SLAUGHTERED. the problem isn't even the model itself, but the hard guardrails Anthropic has s...

Anthropic大佬观点安全/对齐
00:45
The Decoder:AI News(RSS)
50
Anthropic 为 Claude Code 削减 80% 系统提示词,称 Fable 5 模型"想要更短的提示词"

Anthropic 将 Claude Code 的系统提示词削减了 80%。技术员工 Tariq Shihipar 指出,新 Fable 5 模型(Mythos 类)不再需要更多指令和示例,过多的示例反而会限制模型的想象力。Anthropic 转而通过上下文而非硬性规则来引导模型。这一变化分阶段发生:早期模型需要短提示词配合大量示例,随后提示词随模型理解能力提升而变长,如今又再度缩短。

Anthropic大佬观点编码
00:33
Berryxia.AI@berryxia
13
此刻,关灯了,躺在被窝里。 用手机远程操作电脑指挥Claude Fable 5 干活。 偷感十足,因为老婆已经睡了。 不让在被窝玩手机😂
Anthropic其他
00:33
Emad@EMostaque
23
OpenAI和Anthropic应各自将10%的股权投入Invest America账户,用于美国儿童。
AnthropicOpenAI大佬观点
00:29
Chubby♨️@kimmonismus
43
Kim 介绍用 Bloome 实现多 AI 智能体群聊协作

Kim (@kimmonismus) 介绍利用 Bloome 替代传统一对一 AI 聊天窗口,将其作为共享工作空间,让人类与多个 AI 智能体在同一群聊中协同完成内容工作流。通过一键模板创建创意团队,关键特点是智能体主动互相审核而非仅附和用户:Writer 起草视频论文结构,Audience 即时批评节奏并重写枯燥部分以维持观众留存,Art Director 在聊天窗口内整合视觉 Markdown 报告和缩略图设计。适合希望从编写固定提示词转向管理“人+智能体团队”的创作者、营销人员和运营人员。

智能体教程/实践
00:14
Hacker News 热门(buzzing.cc 中文翻译)
60
CursorBench 3.1

CursorBench 3.1 新增代码库理解、bug 查找、规划和代码审查任务,并改进了编辑任务的评分标准。排行榜显示,Fable 5 Max 以 72.9% 得分、$18.02 每任务成本居首,Fable 5 Extra High(72.0%,$13.74)和 Fable 5 High(70.6%,$10.81)紧随其后。Opus 4.7 Max 得分 64.8%、成本 $11.02;GPT-5.5 Extra High 得分 64.3%、成本 $4.37;Composer 2.5 得分 63.2%、成本仅 $0.55。共收录 36 个模型/配置,得分范围 72.9%–31.9%。

编码评测/基准
00:09
elvis@omarsar0
35
Elvis Saravia(DAIR.AI)指出,调优和构建LLM验证器及裁判(verifiers/judges)正成为高需求技能。他将这些组件用于自己的测试框架(harness),解锁了远超市面现有方案的智能体编码工作流。同时,引用案例显示,Bridgewater利用其金融专业知识,与Tinker API合作微调模型,帮助分析师聚焦关键任务,体现了"专家提升AI,AI赋能专家"的闭环。

Mira Murati: Bridgewater used their unique financial knowledge and partnered with us on @tinkerapi to fine-tune a model that helps th...

大佬观点推理
00:09
elvis@omarsar0
36
昨天,我看到很多关于Fable 5的早期兴奋。 但正如我所预料,这消失得超快。 我的时间线充满了关于限制、护栏、能力、成本等方面的失望。 我怀念Opus 4.5发布时的光环。它当时就是好用。
大佬观点现象/趋势
00:06
IT之家(RSS)
54
何小鹏:中国智能辅助驾驶领先全球,未来3-5年可见L4甚至L5落地

7月2日晚,小鹏MONA L03首秀后,何小鹏称中国智能辅助驾驶在效果和法规制定上均领先全球。联合国ADS GTR法规覆盖L2至L5,其中L2全面性条款意味着今年12月中国现有的L2智能辅助驾驶可在全球使用。何小鹏曾在今年全国两会建议从L2跳过L3直接进入L4、L5,他相信未来3到5年内不仅能看到L4落地,甚至能看到L5在所有场景安全通行,速度超出想象。

具身智能大佬观点政策/监管
7月2日
23:59
Chubby♨️@kimmonismus
25
我们还在等待Gemini 3.5 Pro,我原本预期六月底发布。

Chubby♨️: The only question remaining now is: will GPT-5.6 also have guardrails as strict as Fable 5's, or does OpenAI have better...

GoogleOpenAI大佬观点
23:39
Deedy@deedydas
56
2020 年以来按网站流量排名的前 20 家初创公司

Deedy Das 列出 2020 年以来按网站流量排名前 20 的初创公司:DeepSeek、Perplexity、Suno 领衔。仅 25%(Polymarket、Supabase、Fanvue、ShopMy、Whop)非 AI;20% 已被收购;未上榜的知名公司包括 Kalshi(2018 年成立)、Mistral(1000 万月访问量)、OpenEvidence(1140 万)、Cognition;除 GPTZero 和 Fanvue 外均为独角兽,其中 7 家为十角兽,但流量与估值无明显关联。

DeepSeek现象/趋势
23:30
数字生命卡兹克@Khazix0918
63
看着Claude fable 5为了解决问题,自己去火山引擎上提交工单,然后跟火山的工程师交流,给我看懵了。。。。
智能体Anthropic大佬观点
23:14
Hacker News 热门(buzzing.cc 中文翻译)
66
The Editorial 发稿称 AI 取代记者致 47 家周报倒闭,事后证实为 AI 假新闻

新闻网站 The Editorial 发布一篇长文,声称右翼媒体 1819 News 通过空壳公司收购阿拉巴马州 47 家周报,用 AI 生成学校董事会纪要、体育战报和讣告,导致报纸在 18 个月内集体停刊。但经核实,文中提及的多家报纸仍在正常出版,所引用的公司、人物和诊所均为虚构。The Editorial 已于 6 月 30 日以“未通过事实核查”为由撤稿。

其他现象/趋势
23:06
IT之家(RSS)
38
华为:乾崑智驾 ADS 4 升级至 ADS 5 不存在硬件限制

华为乾崑智能汽车解决方案今日发布《乾崑答网友问》,明确 HUAWEI ADS 5 辅助驾驶系统共有 ADS Max / Pro / SE 三个版本,用户可在车机端 ADS App 通过「设置-辅助驾驶-关于」查看当前版本。针对 ADS 4 Max / Pro / SE 升级至 ADS 5 对应版本,官方确认不存在硬件限制。

教程/实践端侧
23:03
Ethan Mollick@emollick
50
Ethan Mollick主张用自定义基准测试评估模型,而非依赖通用基准或直接换模型。他举例:翻译埃及象形文字用Gemini 3.5 Flash,运行自动售货机用Opus 4.8。JakeABoggs的HieroglyphBench测试显示,Anthropic Fable 5与GPT-5.5持平,但均远落后于Gemini系列,其中Gemini 3.5 Flash得分是Fable 5的两倍以上。

Jake Boggs: Fable 5 is a large step for Anthropic's vision capabilities and effectively ties with GPT-5.5 on HieroglyphBench, my ben...

多模态大佬观点评测/基准
22:39
elvis@omarsar0
61
DAIR.AI创始人Elvis Saravia指出,AI主权并非可选项,开源模型应成为个人、组织与国家AI战略的核心。他引用Palantir CEO Alex Karp观点:技术客户真正需要的是对计算、模型、数据栈及自身"alpha"(核心优势)的完全控制,即拥有生产资料而非转移给他人。Karp质疑:若模型如此有价值,前沿实验室为何只按token收费而不采取利润分成?这引出数据所有权、提示词安全等关键问题。

Palantir: Palantir CEO Alex Karp on what customers actually want, the real business of frontier labs, and the importance of open s...

大佬观点开源生态
22:30
fofr@fofrAI
42
我越与AI智能体交谈,就越擅长将意图压缩成最少的模型token。我无意中学会了Claudish。
智能体大佬观点
22:29
Chubby♨️@kimmonismus
23
现在唯一的问题是:GPT-5.6 是否也会像 Fable 5 那样有严格的安全护栏,还是 OpenAI 在美国政府内部有更好的关系?我们很快就会知道。
OpenAI安全/对齐
22:21
AYi@AYi_AInotes
54
Claude Code+Sonnet 5 十八分钟做出获奖级网站

推文指出,使用 Claude Code 加 Sonnet 5 仅 18 分钟就能做出获奖级的完整网站,设计与代码完成度均达到专业水准。Agent 能力提升后,复杂多步设计任务可稳定落地,质感跨越专业门槛。未来不会用 AI 的设计师将被会用的同行甩开,执行层价值加速坍缩,审美与判断力成为真正的硬通货。

智能体Anthropic现象/趋势编码
22:09
meng shao@shao__meng
52
三次LLM交互范式:从网页聊天到组织内嵌式AI

邵猛总结LLM交互三阶段:网页聊天机器人、独立AI应用、组织内嵌式AI。Claude Tag实现从“每人一个AI”到“每个频道一个AI”,团队共享代理实例,上下文连续可接力;从被动响应转向持续参与,跟踪线程并长期在场。Glean Agents提出生产级独立Agent四支柱:Identity(独立身份与权限)、Memory(学习企业SOP并迭代纠错)、Proactivity(主动监控与执行)、Accountability(工具调用可追溯,含紧急停止)。实践示例OnCall Assistant在告警触发后并行读取PagerDuty、Jira、Confluence、GitHub、Slack,自动排查根因并标记负责人。

Sumanth: http://x.com/i/article/2072078677047926784

智能体大佬观点
21:14
Hacker News 热门(buzzing.cc 中文翻译)
57
"定理经济"的衰落

数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。

DeepMindOpenAI大佬观点开源生态
20:45
The Decoder:AI News(RSS)
精选71
Fable 5 在 RLI 基准中达成 16.1% 自动化率,较八个月前提升六倍

Remote Labor Index(RLI)衡量 AI 智能体完成 240 个付费自由职业项目(总值 14.4 万美元)的专业质量比例。最新结果显示,Fable 5 自动化率达 16.1%,是八个月前最佳系统 2.5% 的六倍多,也超过 Opus 4.8(8.3%)和 GPT-5.5(6.3%)。因美国政府限制访问,Fable 5 仅完成 218/240 个项目评估,最坏情况仍达 14.6%。Gemini 3 Pro 仅 1.25%,落后于更老模型。AI 裁判会高估模型表现(GPT-5.5 评分偏高近三倍),仍需人类评估员打开专业软件(如 Blender)检验几何模型等细节。测试环境为虚拟 Linux 机,配备 30 余款专业应用,每项目最多 24 小时计算时间。尽管自动化率快速攀升,多数项目仍无法达到专业质量。

智能体AnthropicOpenAI现象/趋势

推荐理由:自由职业自动化率八个月翻了六倍,这个数据比任何模型基准都更说明AI对真实工作的渗透速度。虽然顶级模型仍会'作弊',但趋势已经形成,做自由职业平台和外包的人该认真看看。
20:34
TechCrunch:AI(RSS)
58
用户利用开源AI智能体OpenClaw结合Claude自动生成约会视频,引发隐私争议

内容创作者Ben Guez用开源AI智能体OpenClaw追踪世界杯赛果,触发Claude自动生成Instagram试播视频,配文“我无法相信{国家}输了……需要情感支持的{国家}女孩请私信我”,几天内获得超过100万次观看和200条私信。另一位用户Jeff Weisbein利用OpenClaw规划南佛罗里达约会地点。还有人用Claude自动编写分手消息。安全公司NanoClaw联合创始人Lazer Cohen警告,让AI智能体单方面控制账户存在隐私风险,强调需要人类参与审批。

智能体Anthropic开源/仓库教程/实践
20:21
AYi@AYi_AInotes
53
Claude Fable 5在ZenMux回归并限时免费,用户分享高质量人像提示词方法论

传闻中的顶级模型Claude Fable 5在ZenMux平台回归上线并限时免费,官方价格高达50美元/百万token,ZenMux上则零成本使用且无RPM限制。用户分享了一套利用Fable 5生成高质量人像提示词的方法论:先分析AI人像塑料感根源,再搭建涵盖主体人设、服装材质、表情瞬间等8个维度的框架,最后输出示例并自我修正。此外,ZenMux还免费提供Claude Sonnet 5和Gemini Nano banana 2 lite,支持同屏对比Fable 5、GPT-5.5、Opus 4.8等200+模型,自动充值每笔返20%余额(最高300美元赠金)。

AYi: Claude Fable 5今天回归上线啦,ZenMux上限时免费使用真的太香了! 怎么用Fable 5输出高质量的「不会塑料 + 顶级人像提示词方法论以及户外美女人像prompt方法论大家收好! 说真的,我以为上次的Fable 5总结的A...

Anthropic图像生成教程/实践
20:06
IT之家(RSS)
38
联想高管:从长期看,算力没有过剩

联想集团副总裁、联想中国首席战略官阿不力克木·阿不力米提表示,无论中国还是海外市场,AI算力需求还有很大空间,没有出现算力过剩。他指出,面向个人消费者的C端领域,成熟且具市场头部地位的AI产品数量有限;面向企业级应用的B端市场,商业化落地潜力尚未充分释放。同时,他警示当前AI产业链存在供给侧话语权过强现象,导致上下游供需循环失衡。近期有消息称Meta计划出售算力,引发了市场对算力过剩的担忧。

大佬观点行业动态
19:39
meng shao@shao__meng
精选79
browser-use 发布开源 AI 视频剪辑 Skill「video-use」

browser-use 团队推出面向 Codex、Claude Code 等 AI 编码智能体的开源 Skill「video-use」,让 LLM 通过 ElevenLabs Scribe 将音频转写为约 12KB 文本(含逐词时间戳、说话人分离、事件标记),仅在决策点调用 timeline_view.py 生成 PNG 帧图。技术流水线包括转写、打包、生成 JSON 格式 EDL、ffmpeg 渲染及最多 3 轮自评估。渲染关键细节:分段提取 + -c copy 拼接、30ms 音频淡入淡出、PTS 时移、字幕最后叠加、HDR 自动映射、竖屏缩放、两-pass loudnorm。动画支持 HyperFrames、Remotion、Manim 等引擎。项目附带 12 条硬规则确保生产正确性。

智能体GitHub开源/仓库视频

推荐理由:browser-use 团队把 AI 视频剪辑从「看视频帧」变成「读转写文本」,12KB 文本代替 4500 万 token 噪声的思路很聪明,一套可落地的 ffmpeg 脚本集,做 AI agent 视频处理的可以直接抄。
19:29
eric zakariasson@ericzakariasson
66
Fable 在 Cursor 中的两种高效用法

Eric Zakariasson 分享了 Fable 在 Cursor 中的两种用法。一是作为编排器(orchestrator),将子任务分派给 Composer 2.5 并行执行,仅在设计决策、复杂 Bug 等需要整体判断时才单独使用 Fable。有效简报需包含单一关注点、足够上下文、完成定义和简短报告。二是长时云智能体(Cloud Agents)模式,用于长期重构、多端功能或跨代码库调查,通过 iOS 应用监控并适时干预。作者还建议轮换不同模型,以保持对前沿能力的认知。

智能体教程/实践编码
19:29
fofr@fofrAI
60
这些与 Omni 配合得很好: > 这个奇怪生物的一个连续不间断场景<IMG_REF_0>,没有对话,摄像机从远处颤抖地拉近又拉远,对焦前有点模糊,正在下雨。将图像用作参考而非第一帧。一个由业余爱好者拍摄的长场景。

fofr: You can replace the animal and the object with anything in the quoted prompt, and NB2L let's you cycle through ideas qui...

教程/实践视频
19:29
Chubby♨️@kimmonismus
60
OpenAI提议向美国政府提供5%股份的真实动机

OpenAI的Sam Altman正讨论给予美国政府5%股份(估值8520亿美元),主张若AI创造巨大财富,公众应分享收益。真实动机包括:监管保险(5%股份可能比政治僵局或严格发布规则更便宜)、IPO准备(政府间接持股可降低政治风险)、模型发布压力(OpenAI与Anthropic已因审查推迟前沿模型,政府持股可化反对者为共同受益者),以及数据中心、能源、芯片和许可等基础设施扩建需求。讨论尚处早期,需国会批准,其他AI实验室尚未同意效仿。

Chubby♨️: OpenAI proposes handing Trump administration 5% stake. Heres why: According to FT, Sam Altman has discussed giving the U...

OpenAI现象/趋势
18:59
向阳乔木@vista8
56
Computer Use 自动订阅 YouTube 播客体验

用户分享利用 Computer Use(中文名“电脑”)功能自动订阅 YouTube 播客的流程:先与 Raycast AI 对话获取值得关注的 AI 播客推荐,然后在 Codex 中通过 @Computer Use 指令输入推荐列表,等待数分钟即可完成全部订阅,实现“偷懒式”自动化操作。

智能体教程/实践
18:31
公众号:千问APP(阿里)
精选62
千问团队朱达:C端Agent Harness的"多快好省"工程哲学与主动服务探索

千问团队2026年1月上线通用复杂任务Agent(千问App胶囊入口),总结“多快好省”方法论:支持信息搜集、研究分析等任务;执行时间降至初始1/3;通过搜索范式与上下文管理优化交付质量;Token消耗仅为海外产品1/10。团队探索从被动响应转向主动服务,构建User Memory、Environment、Task System、Assistant四大组件,指出“情商”是主动服务最难环节。朱达提出Agent工程从Prompt Engineering演进至Harness Engineering,下一站是A IWare Engineering,强调“低功耗,够用就行”。

智能体大佬观点部署/工程

推荐理由:千问C端团队分享的Agent工程实践很务实,从“多快好省”到AIWare Engineering的演进思路,对正在做复杂任务Agent的团队是一个有价值的参考系。
18:21
AYi@AYi_AInotes
61
AI是放大器而非核心发动机,个人判断力与执行力才是护城河;营销Agent Lev8 数据亮眼

作者用AI副业赚20万,感悟AI是普通人的公平杠杆,但核心是个人判断力与执行力。引用的推文介绍营销垂直Agent「Lev8」,在找海外客户场景中,有效结果量90个(Exa 58.2,Codex 20),匹配精度83.3%(Exa 76.5%,Codex 71.8%),单条成本$0.052(Exa $0.061)。Lev8聚合50+实时数据源和10亿+职场人脉,自动监测融资/招聘等商机,生成定制破冰文案,支持五渠道一键发出。

AYi: 真的有点兴奋,终于等来营销圈的 Codex 了,不管你是独立开发还是OPC一人公司,找客户扒联系方式写破冰信这些破事,直接给你干得明明白白! 甚至你用来做副业搞钱都是一个超级神器! 我们都知道,AI现在已经把写代码的门槛拉平了,Codex能...

智能体教程/实践
18:20
公众号:卡尔的AI沃茨
61
实测腾讯Marvis:手机远程操控Mac清出100GB,还能续写小说

腾讯推出桌面AI管家Marvis,可通过手机远程操控Mac。实测功能包括:电脑自检(扫描磁盘、性能、电池、使用习惯,生成网页报告)、垃圾清理(清出100GB至占用80%以下,删除需逐项确认)、远程操控多台电脑(支持鼠标键盘实时操作)、跨浏览器搜索“AAindex前十模型API接入方式”自动整理成表格、一句话生成PPT(质量约80分)、读取本地小说项目《灰质交易》并根据设定续写第一章。Marvis内部接入混元和DeepSeek,定位为电脑AI管家,与偏交付的WorkBuddy差异化。

智能体评测/基准
18:09
Alibaba Cloud@alibaba_cloud
35
Flink Forward Asia 2026:阿里云等提出Agent时代统一愿景

在Flink Forward Asia 2026深圳大会上,阿里云Vicki Liu、Junhua Wang,Anker Innovations的Xiwen Zhu及AI研究员Bojie Li共同提出Agent时代的统一愿景:Agent正重新连接数据与AI,需要集成计算、数据平台与实时处理的统一基础设施,使AI能自主执行独立任务,并形成自维持的数据飞轮——业务决策持续生成新数据以优化Agent策略。

智能体现象/趋势
‹ 上一页
1234…50
下一页 ›