智能助手网
标签聚合 模型

/tag/模型

linux.do · 2026-04-18 22:12:42+08:00 · tech

现在是不是有那种自动扫公益站模型的项目啊?一看到gpt-5.4就起飞了? 说明是不看的,模型是要蹬的。 科普: 1.感觉l站最近新人确实有点多了,都以为gpt的pro模型和gemini的pro,claude的opus一样,其实gpt-pro模型更类似gemini的deepthink,所以请不要把这个模型放到codex好吗? 2.我这么大一个 不支持codex,只支持/v1/chat/completions请求 没人看见吗。。。 11 个帖子 - 10 位参与者 阅读完整话题

linux.do · 2026-04-18 21:54:22+08:00 · tech

场景:私有大模型服务器,公司买的K100AI的卡8*64的显存 内存900g 硬盘11T 海光DCU 现在安装模型,只能安装海光的提供的模型,且只能定制对方提供的docker镜像和vllm指定的版本 以及模型。 想用来做claude code的调用安装模型。目前按照了千问的122b激活a8b的模型 但是claude code调用有问题,串行的命令无法执行。 比如:帮我优化某某方法。 私有模型:说一句话就停住了,根本走不下去,没有edit,只有单独的add内容 购买的coding plan 同样的场景 是正常没问题的 有没有佬遇到这种情况,是咋处理的。。。 厂商那边沟通费劲。 5 个帖子 - 2 位参与者 阅读完整话题

linux.do · 2026-04-18 21:51:34+08:00 · tech

旧闻了 iPhone 用户现在也可以在手机上运行 Google 新发布的 Gemma 4 模型了——是真的在手机上运行,断网也能用的那种。 App Store 直接搜 “Google AI Edge Gallery”。打开 APP 后可以选择下载 E2B 或者 E4B。官方显然推荐大家用 E2B 这个更小也更快的版本。 除了文本对话,还有图片识别、语音对话等,甚至还支持 Skills。但是实测知识是 2025 年 1 月以前的。 推理框架用了 iPhone 的 GPU,运行还是相当流畅的。 大家可以试试,日常处理文本翻译之类的应该绰绰有余。 8 个帖子 - 5 位参与者 阅读完整话题

linux.do · 2026-04-18 21:38:18+08:00 · tech

发现大模型尤其是openai家的模型给出的文稿里尤其喜欢使用否定型句式,几乎每一段都有形如「不是…而是…」这种的倾向于给出否定某个方面的句型。如果只是拿它来修代码还好,但如果用于润色文章的话读的真有点抓狂,想问各位佬友有没有什么比较好的解决办法,比如说用什么prompt规范文风什么的?有没有什么好用的提示词推荐? 12 个帖子 - 9 位参与者 阅读完整话题

linux.do · 2026-04-18 17:32:58+08:00 · tech

​如题,之前的最大优点就是语言模型、视频模型、图像模型、声音模型并行,好像是国内唯一几家能够All in one的模型公司。 结果现在编码模型还是M2.7、性能严重落后,原来量大管饱、便宜的优点现在不值一提,直接就是拉完了,而且没有看到公司在编码模型上面还有什么宏大的计划。 视频模型本来也不错,结果字节的模型一出来,openai的sora 都关了。Minimax后续打算咋弄,是学openai,把 视频模型也关了,All in全部算力堆在编码模型上,还是有其他方向? 总之感觉现在Minimax的股价很危险呀,现有的模型实力好像没有体现出什么先进性,原本起步早的优点,小米的新模型都把它冲破了,国内其他传统的额互联网大公司也在冲刺,护城河可以说没有了 附:grok统计的各家模型参数量大小 17 个帖子 - 13 位参与者 阅读完整话题

linux.do · 2026-04-18 16:07:34+08:00 · tech

为什么切换任何模型都报错503呢?佬们救救我 没有AI就不会敲代码了 { “error”: { “code”: 503, “details”: [ { “ @type ”: “ type.googleapis.com/google.rpc.ErrorInfo ”, “domain”: “ cloudcode-pa.googleapis.com ”, “metadata”: { “model”: “gemini-3-flash-agent” }, “reason”: “MODEL_CAPACITY_EXHAUSTED” }, { “ @type ”: “ type.googleapis.com/google.rpc.RetryInfo ”, “retryDelay”: “26s” } ], “message”: “No capacity available for model gemini-3-flash-agent on the server”, “status”: “UNAVAILABLE” } } 14 个帖子 - 9 位参与者 阅读完整话题

linux.do · 2026-04-18 16:01:52+08:00 · tech

各位大佬们,下午好,本人最近新购入一台macAir 16G 512内存本子准备大干一场,最近国外的模型不好调用,抽也抽不到,抢key也抢不到,哈哈我手太慢了,所有想能够在本地搭建一个 小型的模型供自己使用 gpt 或者御三家都可以的模型(我是小白,各位如果觉得离谱不要喷我),因为我的代码没有那么高深,所以日常够用就行,有的老友说,你可以去用在线模型呀,我最近用trae模型一直在排队,所有我就萌生了自己搭建一个模型的想法。 如果各位佬友们有那种保姆级的入门教程,如何快速搭建一套完整的模型的教程的话,可以分享一下,感激不尽。谢谢大家。 粗体文本 8 个帖子 - 8 位参与者 阅读完整话题