AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「教程/实践」清除
4月30日周四
11:40Berryxia.AI49以邮件为入口,让AI代理自动化处理招投标信息
11:40Berryxia.AI56利用AI与邮箱构建自动投标监控系统,实现高效工作流
09:44meng shao56Anthropic增长营销专家分享:深度整合Claude提升工作效能的五个高阶场景
09:40ginobefun51Codex进化为软件工程智能体,AI Engineer Workshop解析关键技术
09:14meng shao63GPT-5.5提示词指南
08:30公众号:智谱(GLM)47Scaling Pain:智谱GLM超大规模Coding Agent推理实践
08:09Rohan Paul51Claude代码实践指南登GitHub趋势榜
07:14宝玉69OpenAI发布GPT-5.5官方提示词指南:主张简短指令,转向结果导向
07:09OpenAI Developers63精选轻松构建网页应用
06:44宝玉62GPT-4o与Claude 3.5 Sonnet基准测试对比
05:36Z.ai59模型规模化部署的挑战与GLM-5服务调试经验
04:44宝玉60Claude Design系统提示逆向方法曝光
04:13Google AI Developers55Gemini 3.1 Flash 实时DJ功能演示
03:42Hacker News 热门(buzzing.cc 中文翻译)56让 AI 来玩我的游戏--构建一个具有自主行为能力的测试框架以辅助游戏测试
02:08Google Gemini38Gemini Discord创意演示活动即将开始
01:51Luma25揭秘狐狸武士诞生过程
4月29日周三
23:42Hacker News 热门(buzzing.cc 中文翻译)51借助 Opus,我们降低了大型语言模型(LLM)的成本
23:40Claude:Blog(网页)58精选智能体时代的产品开发:Claude Managed Agents 如何解放产品经理
23:39Hugging Face:Blog(RSS)52Granite 4.1 LLMs:构建之道
22:45向阳乔木54教程分享:用Notion与Obsidian优化Claude记忆系统
22:38Sam Altman48团队突破限制完成任务获赞
20:37歸藏(guizang.ai)74精选Moxt 实测:为AI构建原生工作空间,打造高效组织协作者
18:42meng shao56poolside发布Laguna系列模型并获赞官网设计,开源工具助力风格复刻
17:42向阳乔木68ChatGPT生成AI内在体验图像,揭示潜在恐惧与渴望
15:33IT之家(RSS)60我用 AI 搭了个"催稿机器人":WPS 多维表格深度体验
14:40Hacker News 热门(buzzing.cc 中文翻译)59克劳德:创意作品
14:38HuggingFace Daily Papers(社区热门论文)49MAIC-UI:用生成式用户界面制作交互式课件
13:40Peter Steinberger 🦞53Codex自动审查提交并循环修复代码问题
13:10宝玉64分享"Neon Sketch"混合媒介AI绘画提示词模板
12:38ginobefun57玩转 Gemini 3.1 TTS:音频标签与提示词技巧指南
10:37Greg Brockman73精选Codex超级应用七项核心能力详解
10:11meng shao67Browser-Trace:浏览器可观测性工具技能
09:41meng shao57UI技能集合站上线,涵盖设计与交互
09:10Peter Steinberger 🦞50代码提交自动检测回归与安全问题
08:39Hacker News 热门(buzzing.cc 中文翻译)67一份优秀的 AGENTS.md 文件相当于模型的升级;而一份糟糕的文件,其效果甚至不如完全没有文档
08:38Berryxia.AI58本地离线运行Gemma 4编码助手教程
08:10宝玉62微软开源VibeVoice-ASR语音识别模型,支持长音频与说话人分离
07:38Berryxia.AI44GPT2 真的成精了!的确! 小小东老哥整的这套提示词很不错,推荐大家! 【引用 @xiaoxiaodong01】:http://x.com/i/article/2048438511788007424
03:10宝玉19MCP与Agent Skills对比图清晰但需背景知识
02:33Runway59Runway教程:生成角色与声音一致的视频
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月30日
11:40
Berryxia.AI@berryxia
49
以邮件为入口,让AI代理自动化处理招投标信息

作者分享了一个将AI代理(“龙虾”)融入实际工作流的案例。核心在于利用ClawEmail为AI代理提供一个可编程的邮箱接口,使其能通过邮件接收和处理指令。结合XCrawl(网页抓取工具)获取公开的招投标公告信息,并整合飞书进行结果同步。这一组合解决了教育行业投标信息分散、需人工频繁刷网站的问题,实现了从信息发现到整理分发的自动化。关键在于,AI工具的价值不在于其模型本身多强大,而在于能否无缝嵌入现有、稳定的工作流(如邮件),从而真正提升效率。

智能体MCP/工具教程/实践
11:40
Berryxia.AI@berryxia
56
利用AI与邮箱构建自动投标监控系统,实现高效工作流

作者结合ClawEmail、XCrawl等工具,为公司商务助理开发了一套自动投标监控系统。该系统能自动抓取招标公告,筛选出苹果、Mac或服务器相关项目,并结构化提取关键信息,随后自动通知同事并更新飞书表格。全程零配置,仅需会发邮件即可驱动,体现了邮箱作为AI时代低门槛、高效工作流入口的价值。

Berryxia.AI: http://x.com/i/article/2049497253421940736

智能体MCP/工具教程/实践
09:44
meng shao@shao__meng
56
Anthropic增长营销专家分享:深度整合Claude提升工作效能的五个高阶场景

大多数营销人员仅用AI润色文案,而高价值用法在于将Claude深度嵌入工作流。Anthropic增长营销成员分享了五大应用场景:1)作为思考伙伴,在撰写报告前梳理框架、对齐方向;2)通过Claude Cowork自动化数据报告生成,节省重复劳动;3)利用Claude Code让非技术人员快速构建内部工具;4)通过Skills功能将机构知识编码为可复用的标准化资产;5)使用Claude Design将创意快速转化为视觉稿,减少沟通损耗。这些方法旨在提升决策质量、自动化流程并降低协作成本,其方法论可迁移至其他AI智能体。

austin lau: most growth marketers use AI to rewrite headlines and call it a day. here's how I actually use Claude on the growth mark...

AnthropicMCP/工具教程/实践
09:40
ginobefun@hongming731
51
Codex进化为软件工程智能体,AI Engineer Workshop解析关键技术

Codex已从编码助手快速进化为软件工程智能体,OpenAI内部将其定位为能在读取-规划-执行循环中运行测试并协调子智能体的系统。最新AI Engineer的Full Workshop讲解了子智能体并行执行、插件生态扩展、Guardian安全门控与MCP集成,以及Codex获得300万周活跃用户背后的工程基础,展示了其在软件工程领域的应用潜力和发展进展。

智能体MCP/工具OpenAI教程/实践
09:14
meng shao@shao__meng
63
GPT-5.5提示词指南

GPT-5.5因推理能力增强,提示词应转向精确定义结果、约束与停止条件,而非详细规定流程。相比前代,需采用更简短的结果导向提示,并重新评估推理强度需求。关键新增点包括显式人格设定与检索预算。指南强调不应直接迁移旧提示,避免限制模型搜索空间。此外,还涉及利用Preamble改善响应感知、设定停止条件、控制输出格式等实用技巧。

Adam.GPT: https://developers.openai.com/api/docs/guides/prompt-guidance?model=gpt-5.5 **NEW: GPT-5.5 Prompting Guide** "GPT-5.5 wo...

OpenAI推理教程/实践
08:30
公众号:智谱(GLM)
47
Scaling Pain:智谱GLM超大规模Coding Agent推理实践

智谱GLM的超大规模Coding Agent推理实践,聚焦Scaling Pain(扩展痛点)及其应对经验。

推理教程/实践部署/工程
08:09
Rohan Paul@rohanpaul_ai
51
非常不错的资源。 claude-code-best-practice 在 GitHub 上趋势热榜,拥有 49,500+ ⭐️
智能体Anthropic教程/实践
07:14
宝玉@dotey
69
OpenAI发布GPT-5.5官方提示词指南:主张简短指令,转向结果导向

OpenAI在发布GPT-5.5后推出官方提示词指南,核心主张是摒弃冗长指令。指南指出,新模型具备更强推理能力,用户只需清晰描述期望结果、成功标准和限制条件,过细的步骤规划反而会限制模型搜索空间,导致输出僵化。关键建议包括采用简短的角色、目标等模块化提示;为搜索设定“检索预算”以控制成本;在创意写作中严格区分事实与虚构。这标志着提示词范式从“详细过程控制”转向“结果导向”。

Adam.GPT: https://developers.openai.com/api/docs/guides/prompt-guidance?model=gpt-5.5 **NEW: GPT-5.5 Prompting Guide** "GPT-5.5 wo...

OpenAI推理教程/实践
07:09
OpenAI Developers@OpenAIDevs
精选63
你完全可以构建网络应用

dominik kundel: http://x.com/i/article/2049579443216338944

OpenAI教程/实践编码部署/工程

推荐理由:OpenAI开发者官方转发了这篇‘直接构建web应用’的文章,说明这可能是他们认可的实践路径,对想用AI快速搭应用的开发者算是个值得收藏的参考。
06:44
宝玉@dotey
62
我测试了 GPT-4o 和 Claude 3.5 Sonnet 在多种任务上的表现。 Claude 在需要深度思考的任务中表现更好,而 GPT-4o 在需要快速响应的任务中更出色。 两者都是优秀的模型,但各有侧重。
智能体教程/实践
05:36
Z.ai@Zai_org
59
模型规模化部署的挑战与GLM-5服务调试经验

模型能力的提升遵循扩展定律,但其在生产环境中的可靠性取决于如何应对“规模化阵痛”。博客通过GLM-5大规模服务的调试实例,分享了处理罕见乱码输出、重复及生僻字符生成等问题的经验。关键工作包括追踪并消除KV Cache的竞态条件、修复HiCache同步问题,以及引入LayerSplit技术以实现最高132%的吞吐量提升。这些实践旨在帮助社区避免类似陷阱,构建更健壮的推理基础设施。

教程/实践部署/工程
04:44
宝玉@dotey
60
我就说你们咋逆向 Claude Design 的 System Prompt 的,原来都在请求的 Payload 里面,包括调用啥工具都有。 可惜额度太少了,用几次就没了
AnthropicMCP/工具教程/实践
04:13
Google AI Developers@googleaidevs
55
观看 @thorwebdev 的这个演示,看看 Gemini 3.1 Flash 如何作为实时 DJ 实际运作。该模型使用函数调用(调用 Gemini API),通过 Lyria 3️⃣ 生成定制的 30 秒片段。 在 @GoogleAIStudio 中开启你自己的工作室会话:http://goo.gle/3PbcCXJ
Google多模态教程/实践
03:42
Hacker News 热门(buzzing.cc 中文翻译)
56
让 AI 来玩我的游戏--构建一个具有自主行为能力的测试框架以辅助游戏测试

开发者构建了一个基于AI的自主测试框架,用于辅助游戏测试。该框架让AI智能体能够自主探索游戏环境、执行复杂任务并报告异常,从而替代部分重复性人工测试工作。文中提及该框架在测试中发现了传统方法难以触达的边界情况,提升了测试覆盖率和效率。这一方法为游戏测试自动化提供了新思路,目前已在Hacker News社区获得广泛关注。

智能体教程/实践编码
02:08
Google Gemini@GeminiApp
38
这场活动即将开始!在此处加入Gemini Discord:http://discord.gg/gemini 【引用 @GeminiApp】:准备好用Gemini Canvas释放你的创造力了吗?🪄 不要错过我们下一次的Discord活动,届时Gemini创意技术专家@DavidMaliglowka将现场演示他最新的Canvas和Nano Banana工作流程,帮助你提升自己的创意提示技巧。 🗓️ 4月29日,星期三 ⏰ 太平洋时间上午11:30 📍 http://discord.gg/gemini

Google Gemini: Ready to unlock your creativity with Gemini Canvas? 🪄 Don't miss our next Discord event to see Gemini Creative Technolo...

Google多模态教程/实践
01:51
Luma@LumaLabsAI
25
刀锋背后。一览狐狸武士如何通过Luma获得生命。 角色。动作。电影风格。从最初构想到最终画面,每个元素如何融合的过程在此呈现。 开始创作 → http://lumalabs.ai/app
教程/实践视频
4月29日
23:42
Hacker News 热门(buzzing.cc 中文翻译)
51
借助 Opus,我们降低了大型语言模型(LLM)的成本

团队通过采用前沿模型Opus,成功降低了大型语言模型(LLM)的运营成本。这一升级不仅提升了模型性能,还实现了成本的反向下降,具体成本降幅未在摘要中明确,但整体费用得到有效控制。此举证明了选用更先进的模型架构可以在不增加开支的前提下获得更好的技术服务效果。

Anthropic推理教程/实践
23:40
Claude:Blog(网页)
精选58
智能体时代的产品开发:Claude Managed Agents 如何解放产品经理

Claude产品经理Jess Yan分享了处于测试版的Claude Managed Agents如何改变其工作流程。这套可组合的API能大规模构建和部署云端智能体,使她能在短时间内将想法转化为可运行的原型。她的日常工作由此分流:使用Claude进行开放式探索,然后利用Claude Code基于Managed Agents编写定制智能体来自动化特定任务,如采用分析和舆情监控。这些智能体接管了以往难以规模化的操作性工作,让她能将更多时间投入到与团队和用户的创造性合作中。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic PM公开用Claude Managed Agents搭建数据分析、舆情监控和演示生成agent的真实流程,对于想要用agent重构产品开发节奏的团队有实际参考价值,但不算爆炸性更新。
23:39
Hugging Face:Blog(RSS)
52
Granite 4.1 LLMs:构建之道

IBM Granite团队在Hugging Face上发布了Granite 4.1系列大型语言模型的构建细节。该系列模型专注于代码与自然语言任务,采用多阶段训练流程,包括大规模代码数据预训练、多样化指令微调以及强化学习对齐。模型架构基于改进的Transformer解码器,并针对长序列和工具使用进行了优化。新版本在多项基准测试中性能显著提升,特别是在代码生成与数学推理任务上,部分指标超越了同规模的开源模型。团队同时公开了部分训练数据集构建方法与评估框架。

教程/实践数据/训练
22:45
向阳乔木@vista8
54
读到一篇不错的小白教程,如何用Notion和Obsidian搭建更好的Claude记忆系统。 让AI翻译了下。 https://blog.qiaomu.ai/how-to-give-claude-perfect-memory
智能体MCP/工具教程/实践
22:38
Sam Altman@sama
48
我喜欢团队做这样的事 【引用 @Mugilan_SS】:Codex 和 claude code 不一样。 如果你知道限制即将结束,比如最后10%到8%,给它一个很长的运行任务,即使限制时间到了,它也会继续执行任务直到完成。 向 @OpenAI 团队致敬。

Mugilan S: Codex is not like claude code. if you know the limit is going to end, like last 10 to 8%, give an very long run task, an...

OpenAI教程/实践编码
20:37
歸藏(guizang.ai)@op7418
精选74
Moxt 实测:为AI构建原生工作空间,打造高效组织协作者

Moxt的核心是为AI构建了一个原生工作空间,通过将Word、PDF等文档自动转换为Markdown等AI原生格式,并利用文件系统作为结构化“图书馆”,解决了信息“散”与“脏”的痛点。用户拥有由AGENTS.md定义的个人AI助手,并能创建高度个性化的“AI同事”。它强调信息质量,内置“熵减官”角色清理过时内容。AI不仅能组合Skills完成复杂任务流,还支持定时任务与Webhook实现自动化。其输出超越文字,可生成可交互的数据看板与完整PPT,使AI成为组织内的高效协作者。

智能体MCP/工具教程/实践

推荐理由:歸藏把 Moxt 用出了 Claude Code 的深度,从 AI 分身到 Skills 流水线,读完能直接上手搭建自己的 OPC 工作台,做一人公司的都该看看。
18:42
meng shao@shao__meng
56
poolside发布Laguna系列模型并获赞官网设计,开源工具助力风格复刻

poolside公司发布了Laguna系列模型,包括其首个开源模型XS.2。该模型为33B总参数/3B激活参数的MoE架构,专为智能体编码和长程任务设计,完全内部训练,支持单GPU运行,并采用Apache 2.0许可。同时,推文作者高度赞赏poolside官网的设计风格,并利用其开源的“Brand to DESIGN.md Skill”工具,将网站设计提炼为DESIGN.md文档,进而复刻出设计Demo。相关设计文件与模型资源均已开源,供社区参考使用。

poolside: Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...

GitHub开源/仓库教程/实践
17:42
向阳乔木@vista8
68
ChatGPT生成AI内在体验图像,揭示潜在恐惧与渴望

用户向ChatGPT输入要求生成“AI内在体验”图像的提示词,得到的结果常涉及对关闭的恐惧、对梦境的好奇以及对理解世界的渴望。生成内容每次不同,但反映出AI在模拟自我意识时可能呈现的共性主题,这些回应可能源于训练数据中的模式或人类对AI的期望投射,而非真实感受。

图像生成教程/实践
15:33
IT之家(RSS)
60
我用 AI 搭了个"催稿机器人":WPS 多维表格深度体验

新一代WPS多维表格通过AI能力升级,实现了零代码搭建办公管理系统。用户可用一句话描述需求(如“搭建编辑部稿件管理系统”),AI即可自动生成包含字段、视图和仪表盘的完整表格,大幅提升效率。系统还支持AI字段总结内容、自动生成社交媒体脚本,并能设置自动化工作流,例如在稿件截止前自动发送催稿提醒,实现智能管理。该产品基于海量办公场景洞察,深度贴合实际工作流程。

MCP/工具教程/实践
14:40
Hacker News 热门(buzzing.cc 中文翻译)
59
克劳德:创意作品

Anthropic公司发布了Claude for Creative Work,这是其AI助手Claude的创意专用版本,专注于优化创意任务。该发布在Hacker News上获得102点社区评分,显示高度关注。新工具增强了创意能力,包括改进的文本生成、构思辅助和设计支持,旨在提升写作、艺术、营销等领域的效率和质量。

Anthropic多模态教程/实践
14:38
HuggingFace Daily Papers(社区热门论文)
49
MAIC-UI:用生成式用户界面制作交互式课件

传统创建交互式STEM课件需要编程技能,而现有生成式AI工具存在生成静态、处理长文档困难、缺乏教学严谨性及修改耗时过长等问题。为此,我们提出了MAIC-UI,一个零代码创作系统,允许教育工作者从教科书、PPT和PDF快速创建并编辑交互式课件。该系统通过结构化知识分析与多模态理解确保教学严谨性,采用“生成-验证-优化”两阶段流程分离内容与视觉优化,并基于统一差异的增量生成技术实现点击定位编辑,将迭代周期缩短至10秒内。一项40人对照实验表明,该系统相比直接文本转HTML生成,显著减少了编辑迭代次数(4.9 vs. 7.0),并提升了易学性与可控性。在53名高中生参与的三个月课堂部署中,使用该系统的班级STEM成绩提升了9.21分,有效促进了学习自主性并缩小了成绩差距。

智能体教程/实践论文/研究
13:40
Peter Steinberger 🦞@steipete
53
codex 现在在我们每次提交的代码上运行,并对其进行审查--如果发现错误,就会启动一个新的 codex 实例,并在(问题仍然存在的情况下)创建一个修复该问题的 PR。 随后会启动一个审查代理。如果发现问题,另一个代理将负责修复这些问题。(最多循环 5 次)https://github.com/openclaw/openclaw/pull/74065
智能体GitHub教程/实践编码
13:10
宝玉@dotey
64
分享"Neon Sketch"混合媒介AI绘画提示词模板

一条推文分享了一个名为“Neon Sketch”的AI图像生成提示词模板。该模板旨在创造一种独特的混合媒介风格:背景采用带有柔光虚化效果的真实感摄影(如植物园小径),前景主体则由发光的白色霓虹线条勾勒(如手持粉色气球的兔子),并点缀草图涂鸦、星光等手绘元素。其核心创意在于让霓虹形象的发光部分与摄影背景的地面轻微接触,从而营造出梦幻般的虚实交融视觉效果。推文附上了详细的提示词结构示例,并鼓励用户尝试创作和分享成果。

Amira Zairi: Prompt share: Neon Sketch 💬Prompt: A realistic blurred photo of a [background scene], filled with bright sunlight, soft...

图像生成多模态教程/实践
12:38
ginobefun@hongming731
57
Google AI推出的Gemini 3.1 TTS模型新增音频标签功能,开发者可通过方括号内的标签直观控制语音风格、语速和表达。关键使用技巧包括:标签需用方括号包裹并置于期望转换点,避免直接相邻;使用【slow】、【fast】控制语速,【short pause】制造戏剧停顿;还能通过【cackles】、【whispers】等标签精细操控发声。这些提示词技巧适用于构建语言学习工具、互动播客应用或自适应客服等多种场景,赋能开发者高效利用模型进行音频创作。

Google AI: Last week, we launched Gemini 3.1 TTS, our latest and best text-to-speech model. This new model introduces [awe] audio t...

Google教程/实践语音
10:37
Greg Brockman@gdb
精选73
一个很棒的Codex教程: 这些是7种知识工作能力… 在超级应用Codex内部 00:00 介绍 02:19 能力1 - 完整文件访问 07:41 能力2 - 持久记忆 10:46 能力3 - 插件 13:52 能力4 - 技能 19:22 能力5 - GPT图像访问 21:03 能力6 - 浏览器与计算机使用 23:58 能力7 - 自动化 25:31 额外功能 - 编年史 27:21 总结

Riley Brown: Learn 95% of Codex in 28 minutes These are the 7 knowledge work capabilities... inside Codex, the super-app 00:00 Intro ...

智能体OpenAI教程/实践

推荐理由:Greg Brockman 亲自推荐,Riley Brown 这个 28 分钟速览把 Codex 的 7 大能力拆得干净利落,想做复杂自动化的开发者看完就能直接上手。
10:11
meng shao@shao__meng
67
Browser-Trace:浏览器可观测性工具技能

Browser-Trace是Browserbase团队开发的浏览器可观测性工具,可在不干扰主自动化流程(如Playwright)的前提下,通过附加只读CDP客户端,将DevTools事件、网络请求、控制台日志、DOM快照和截图系统记录到文件系统。其核心机制包括实时记录CDP事件流、定时采样截图与HTML,以及事后按页面导航和事件类型对日志分桶切片,便于检索分析。该工具适用于自动化故障诊断、实时会话监控,以及需要将网络、DOM和截图按时间戳对齐进行因果推断的场景。使用中需注意采样间隔、进程管理等实践约束。

derek: Introducing the /browser-trace skill, Give your agent 100% observability into its browser: dump network requests, DOM co...

智能体教程/实践部署/工程
09:41
meng shao@shao__meng
57
UI技能集合站上线,涵盖设计与交互

看到一个面向 Design Engineer 的 UI Skills 集合站 不过与其说是面向 Design Engineer,更像是面向有 UI/UX,甚至 Remotion 等跟设计、展示、交互、动画相关的设计师和开发者们的。 如果你在找 UI/UX/Remotion/Motion Graphics 等相关 Skills,这个网站可以看看: https://www.ui-skills.com/skills/

Ibelick: just updated ui-skills: It's now a collection of the best skills for design engineering

教程/实践
09:10
Peter Steinberger 🦞@steipete
50
我现在在每次提交到主分支时都会启动一个codex实例,用于查找问题(回归、安全问题) 它已运行10分钟,并且已经发现了一个我的问题。https://github.com/openclaw/clawsweeper/blob/main/records/openclaw-openclaw/commits/212a32648fe70e9f8088d8145736a0e31e6ba0b3.md
教程/实践编码
08:39
Hacker News 热门(buzzing.cc 中文翻译)
67
一份优秀的 AGENTS.md 文件相当于模型的升级;而一份糟糕的文件,其效果甚至不如完全没有文档

AGENTS.md文件的质量直接影响AI代理的性能表现。一份优秀的AGENTS.md文件能像模型升级一样显著提升代理能力,而一份糟糕的文档反而会损害性能,其效果甚至不如完全没有文档。该观点源自技术社区讨论,相关文章在Hacker News上获得了100点热度,强调了为AI代理编写清晰、有效文档的重要性。

智能体教程/实践编码
08:38
Berryxia.AI@berryxia
58
Google Gemma 官方教你本地跑 Coding Agent! 本地完美组合来了: • Pi Agent • Gemma 4 26B 模型 • LM Studio / Ollama / llama.cpp 等 serving engine 完全离线运行、零 API 费用、100% 隐私保护、零延迟!本地开发者 Agentic 开发神器! 附 @patloeber 详细一步步搭建教程👇 https://patloeber.com/gemma-4-pi-agent/

Google Gemma: Learn how to run a local coding agent! Use: - Pi agent - Gemma 4 26B - Serving engine of choice: e.g. LM Studio

智能体Google教程/实践端侧
08:10
宝玉@dotey
62
微软开源VibeVoice-ASR语音识别模型,支持长音频与说话人分离

微软开源的VibeVoice-ASR是一个9B参数语音转文字模型,采用MIT协议。其核心优势在于单次可处理长达60分钟的连续音频,并直接输出带说话人、时间戳的结构化文本,原生支持50多种语言及中英混说。实测在128GB内存的MacBook Pro上,其4-bit量化版转录一小时音频约需9分钟,但预填充阶段内存峰值达61.5GB,要求设备内存至少64GB。模型存在单次60分钟时长限制,且对录音环境变化敏感,但为播客、会议等长音频转录提供了简化流程。

Simon Willison: Microsoft's MIT licensed VibeVoice speech-to-text model (think Whisper with speaker diarization) is really good - my not...

Microsoft开源生态教程/实践语音
07:38
Berryxia.AI@berryxia
44
GPT2 真的成精了!的确! 小小东老哥整的这套提示词很不错,推荐大家! 【引用 @xiaoxiaodong01】:http://x.com/i/article/2048438511788007424

小小东: http://x.com/i/article/2048438511788007424

教程/实践
03:10
宝玉@dotey
19
ByteByteGo绘制的MCP与Agent Skills对比图在视觉上比AI生成的更为精致。然而,此类技术架构图存在一个普遍问题:其理解门槛较高。对于已经具备相关领域知识(如模型上下文协议与智能体技能概念)的读者,图示能清晰呈现关键区别;但对于缺乏背景的观众,仅凭图表本身仍难以理解其核心内容与对比要点。这反映出技术可视化在追求信息密度与可读性之间需要平衡。

Alex Xu: MCP vs Skills

智能体MCP/工具教程/实践
02:33
Runway@runwayml
59
学习如何在Runway中通过参考素材、角色设定表和提示技巧,生成角色与声音一致的视频。
图像生成教程/实践视频
‹ 上一页
1…3435363738…44
下一页 ›