智能助手网 - 标签：模型

linux.do · 2026-04-18 22:12:42+08:00 · tech

现在是不是有那种自动扫公益站模型的项目啊？一看到gpt-5.4就起飞了？说明是不看的，模型是要蹬的。科普： 1.感觉l站最近新人确实有点多了，都以为gpt的pro模型和gemini的pro，claude的opus一样，其实gpt-pro模型更类似gemini的deepthink，所以请不要把这个模型放到codex好吗？ 2.我这么大一个不支持codex，只支持/v1/chat/completions请求没人看见吗。。。 11 个帖子 - 10 位参与者阅读完整话题

关于私有模型的一些问题

linux.do · 2026-04-18 21:54:22+08:00 · tech

场景：私有大模型服务器，公司买的K100AI的卡8*64的显存内存900g 硬盘11T 海光DCU 现在安装模型，只能安装海光的提供的模型，且只能定制对方提供的docker镜像和vllm指定的版本以及模型。想用来做claude code的调用安装模型。目前按照了千问的122b激活a8b的模型但是claude code调用有问题，串行的命令无法执行。比如：帮我优化某某方法。私有模型：说一句话就停住了，根本走不下去，没有edit，只有单独的add内容购买的coding plan 同样的场景是正常没问题的有没有佬遇到这种情况，是咋处理的。。。厂商那边沟通费劲。 5 个帖子 - 2 位参与者阅读完整话题

大家手机端试过 Gemma4 没有？

linux.do · 2026-04-18 21:51:34+08:00 · tech

旧闻了 iPhone 用户现在也可以在手机上运行 Google 新发布的 Gemma 4 模型了——是真的在手机上运行，断网也能用的那种。 App Store 直接搜 “Google AI Edge Gallery”。打开 APP 后可以选择下载 E2B 或者 E4B。官方显然推荐大家用 E2B 这个更小也更快的版本。除了文本对话，还有图片识别、语音对话等，甚至还支持 Skills。但是实测知识是 2025 年 1 月以前的。推理框架用了 iPhone 的 GPU，运行还是相当流畅的。大家可以试试，日常处理文本翻译之类的应该绰绰有余。 8 个帖子 - 5 位参与者阅读完整话题

如何才能让AI不频繁使用「不是...而是」句型

linux.do · 2026-04-18 21:38:18+08:00 · tech

发现大模型尤其是openai家的模型给出的文稿里尤其喜欢使用否定型句式，几乎每一段都有形如「不是…而是…」这种的倾向于给出否定某个方面的句型。如果只是拿它来修代码还好，但如果用于润色文章的话读的真有点抓狂，想问各位佬友有没有什么比较好的解决办法，比如说用什么prompt规范文风什么的？有没有什么好用的提示词推荐？ 12 个帖子 - 9 位参与者阅读完整话题

腾讯的 Token Plan 出了个企业版，但是这个价格 5,000 元/月 ~ 20,000 元/月 ....

linux.do · 2026-04-18 21:30:11+08:00 · tech

cloud.tencent.com 大模型服务平台 TokenHub Token Plan 企业版套产品简介 Token Plan企业版 - TokenHub - 控制台看起来是 11亿 5000块的样子… 4 个帖子 - 4 位参与者阅读完整话题

大语言模型蒸馏时学生模型仍可能继承教师模型的偏好

linux.do · 2026-04-18 21:21:18+08:00 · tech

https://www.nature.com/articles/s41586-026-10319-8 1 个帖子 - 1 位参与者阅读完整话题

AMAZON Q的模型怎么就不更新了呢

linux.do · 2026-04-18 21:19:51+08:00 · tech

扩展一直在更新，但模型停止在4.5好几个月了，亚马逊这是放弃了？ 1 个帖子 - 1 位参与者阅读完整话题

最近怎么不见Augment了

linux.do · 2026-04-18 21:18:36+08:00 · tech

这个工具也能使用高级模型，之前一段时间热度也很高啊我记得 6 个帖子 - 6 位参与者阅读完整话题

现在如何判断模型是opus4.7

linux.do · 2026-04-18 20:49:20+08:00 · tech

怎么判断模型是不是真的opus4.7，有没有被路由掺水呢 6 个帖子 - 3 位参与者阅读完整话题

GPT貌似开新号会灰度到image2模型

linux.do · 2026-04-18 20:28:09+08:00 · tech

直接说要生成的图片就有了，甚至2选一，询问用户那个更好，我甚至以为这个是竞技场了。奇怪的是，为什么女主播名字都带鹿鹿的？？？ 10 个帖子 - 5 位参与者阅读完整话题

阿里百炼coding plan用哪个模型，Qwen3.6-Plus感觉不太行

linux.do · 2026-04-18 20:18:14+08:00 · tech

百炼Qwen3.6-Plus用了下，改代码越改越乱，不知道是不是错觉。glm5指令遵循有点差，经常不按在CLAUDE.md或ANGENTS.md中写的测试方法来执行，各位有遇到过吗。kimi2.5用着还行，但百炼上非常不稳定，经常报错，不知道是不是接的claude code的原因。有用百炼coding plan的吗，佬们觉得哪个好用 8 个帖子 - 5 位参与者阅读完整话题

求问SVG 生成模型相关的用途

linux.do · 2026-04-18 20:02:58+08:00 · tech

今天又看到QuiverAI 发布 Arrow 1.1 SVG 生成模型发布，近些这种SVG生成模型好像比较多想求问一下论坛的各位大佬这种类型的模型一般有哪些用途？我个人能想到的是做UI/UX 设计然后就是科研绘图，最主要的还是科研绘图，想问一下有没有佬实操过这类专门为SVG生成的AI绘制一般的科研的图效果如何？ 1 个帖子 - 1 位参与者阅读完整话题

Qcoder模型倍率问题

linux.do · 2026-04-18 19:24:38+08:00 · tech

不懂就问，刚刚开始使用阿里的Qcoder,我发现它的auto模式竟然比其他任何一个高级模型的倍率都高，为什么？一般不都是auto模式的倍率比高级模型倍率都要低吗？ 3 个帖子 - 3 位参与者阅读完整话题

MiniMax现在还有啥大招吗？感觉已经严重落后，股价危矣

linux.do · 2026-04-18 17:32:58+08:00 · tech

如题，之前的最大优点就是语言模型、视频模型、图像模型、声音模型并行，好像是国内唯一几家能够All in one的模型公司。结果现在编码模型还是M2.7、性能严重落后，原来量大管饱、便宜的优点现在不值一提，直接就是拉完了，而且没有看到公司在编码模型上面还有什么宏大的计划。视频模型本来也不错，结果字节的模型一出来，openai的sora 都关了。Minimax后续打算咋弄，是学openai，把视频模型也关了，All in全部算力堆在编码模型上，还是有其他方向？总之感觉现在Minimax的股价很危险呀，现有的模型实力好像没有体现出什么先进性，原本起步早的优点，小米的新模型都把它冲破了，国内其他传统的额互联网大公司也在冲刺，护城河可以说没有了附：grok统计的各家模型参数量大小 17 个帖子 - 13 位参与者阅读完整话题

求助：GPU 云部署开源大模型自用求建议

linux.do · 2026-04-18 17:21:56+08:00 · tech

感谢各位大佬点击该贴。本帖用于求助各位大佬给些关于 GPU云部署开源大模型的建议。我的目的是通过GPU云部署开源大模型为自己提供api使用欢迎各位佬从我的想法、到平台选择、羊毛攻略、模型选择提供建议 5 个帖子 - 3 位参与者阅读完整话题

请问有佬试过移动的这个token吗，有那些模型啊

linux.do · 2026-04-18 16:53:30+08:00 · tech

今天突然收到这个短信，这是指可以调用30000次吗 3 个帖子 - 3 位参与者阅读完整话题

ClaudeCode使用CPA反代Codex的gpt-5.4模型实现破限

linux.do · 2026-04-18 16:35:17+08:00 · tech

需要给ClaudeCode和LLM两者同时破限。学习资料： Claude破限脚本 - 开发调优 / 开发调优, Lv1 - LINUX DO 发一个破限好的codex的提示词，方便大家codex写注册机之类的 - 开发调优 / 开发调优, Lv1 - LINUX DO 1 个帖子 - 1 位参与者阅读完整话题

自从升级antigravity客户端后好像用不了？

linux.do · 2026-04-18 16:07:34+08:00 · tech

为什么切换任何模型都报错503呢？佬们救救我没有AI就不会敲代码了 { “error”: { “code”: 503, “details”: [ { “ @type ”: “ type.googleapis.com/google.rpc.ErrorInfo ”, “domain”: “ cloudcode-pa.googleapis.com ”, “metadata”: { “model”: “gemini-3-flash-agent” }, “reason”: “MODEL_CAPACITY_EXHAUSTED” }, { “ @type ”: “ type.googleapis.com/google.rpc.RetryInfo ”, “retryDelay”: “26s” } ], “message”: “No capacity available for model gemini-3-flash-agent on the server”, “status”: “UNAVAILABLE” } } 14 个帖子 - 9 位参与者阅读完整话题

如何搭建本地gpt等模型给trae用

linux.do · 2026-04-18 16:01:52+08:00 · tech

各位大佬们，下午好，本人最近新购入一台macAir 16G 512内存本子准备大干一场，最近国外的模型不好调用，抽也抽不到，抢key也抢不到，哈哈我手太慢了，所有想能够在本地搭建一个小型的模型供自己使用 gpt 或者御三家都可以的模型（我是小白，各位如果觉得离谱不要喷我），因为我的代码没有那么高深，所以日常够用就行，有的老友说，你可以去用在线模型呀，我最近用trae模型一直在排队，所有我就萌生了自己搭建一个模型的想法。如果各位佬友们有那种保姆级的入门教程，如何快速搭建一套完整的模型的教程的话，可以分享一下，感激不尽。谢谢大家。粗体文本 8 个帖子 - 8 位参与者阅读完整话题

any大善人

linux.do · 2026-04-18 15:51:55+08:00 · tech

今天闲的没事干试了试any能不能用，甚至还出新模型了 4 个帖子 - 4 位参与者阅读完整话题

/tag/模型