ControlNet

喜欢玩,喜欢AI,也喜欢写代码~

$argon2id$v=19$m=64,t=512,p=2$/HemTTbHN6C1+9IgjzaOaQ$nnPRoy8CZcPORZF1MfbEew

尝试着部署了 #openclaw ,感觉这就是一个在交互和UI设置上更加对普通人友好的 coding agent。偶尔用了一下,感觉未来的软件可能不再会用GUI界面进行操作,可能会变成纯对话式。而GUI就会像现在的命令行一样变得硬核专业用户专属了。

@star@nya.one 稍微用了一下,感觉水平和edge半斤八两,没有到那种特别强的地步。

主要是Vivaldi两点还比较缺:
1. 虽然有pin上去的标签页,但是没有那种仅图标的永续标签页(edge正好相反,而arc和zen两个都有)
2. 没有那种方便的同个窗口不同workspace做到cookie隔离的(基于chrome的arc和shift浏览器都支持,更别说基于firefox的container功能的),而edge和vivaldi都只能另外开个新的浏览器,这样在用alt+tab切窗口的时候就会有多个浏览器窗口挺不好用的。

另外还有一个小问题就是 vivaldi 的 HDR 支持有点bug,切到别的tab再切回来就没有了,必须得第一次开这个tab不切出去才行。虽然比firefox全系不支持HDR要好的多。edge还有一个问题就是不能pin一整个标签组,更不好用。

感觉现在只有atlas是Windows全村希望了,毕竟也是大公司支持,看看能走多远吧。

@star@nya.one 哇!这个感觉真可以,马上试试

@kokoro_aya 感觉生态还是挺重要的,有的时候为了那些插件市场还是得选基于chrome的,特别是firefox不支持hdr真的是难受。之前想着如果低层更先进更开放可能会更好,现在感觉遇到了不少麻烦之后还是想要生态最靠谱的(类似于IDE选vsc而不是zed这样)。

@star@nya.one 非常喜欢arc/zen的那个固定标签页设计+标签文件夹的设计,现在看起来比如说vivaldi和edge的垂直标签页基本上只是只有那个小的图标是持久化的,别的包括标签组都是一次性的。

好像openai atlas也在推进这个垂直标签页,可惜没上windows。

特别想要 #arc 的布局和功能,结果arc在windows上的体验极差全是bug。而尝试了半年的#zen 感觉firefox在很多地方的功能上有缺陷,比如说HDR支持,1password的集成支持等等。不知道还有没有哪些靠谱的基于chromium的浏览器有类似的垂直标签+固定标签+多workspace布局?

@skyone@social.akk.moe 这个好像就是默认的搜索方式,似乎效率不是很高,现在用了 https://github.com/nakkaa/aminome 把之前的内容都索引进去了,还算能用

把这个实例迁移到云服务器了,同时还加上了#meilisearch ,可惜meilisearch好像不能index之前的内容。然后还有一点是发现本地用户的头像全部加载不出来了,很奇怪。post里的图像都没问题,而且用chrome也没问题,用firefox就不行。

了解了#n8n#coze#dify 。好像都是一些用于无代码编写基于LLM进行自动化的工具。可惜coze的开源只开源了一半,先不考虑。

先考虑试了下用n8n,感觉最主要的优势是预装了不少的接口,至于本身的操作感觉好像挺一般的。很多操作其实不如直接用python简单写,或者甚至不如直接用vibe coding直接写。感觉n8n一部分的优势是提供了方便进行访问这个设计好的agent,或者设计好某种定时访问、或者通过别的方式进行触发的接口。但是用代码实现本身也不是很难,所以这个就很鸡肋。

刚看到这个:https://air.dev/

没想到
#Jetbrains 也搞了一个AI IDE,叫Jetbrains Air,支持使用openai和a社的订阅,可惜暂时不支持自己用API。

RE: https://social.controlnet.space/notes/ahr1b345d1yq001g

最近#copilot 正式官方支持 #opencode 了,试了一下额度是每月200次requests,跑了几次之后就用了一半,而且opus 4.5的context window被砍到了128K,动不动就得压缩上下文。但是偶尔用一用还是不亏的,比起浪费了每月额度要好。

RE: https://social.controlnet.space/notes/ahh0hg3cidgt002g

试着用#comfyui 跑了下 #wan2.2 ,这个生成技术也太震撼了。目前跑好像只能用用一张图+文字进行生成,跑一次大概400秒。

但是目前问题是,尽管能生成出一个让自己打分80分的,但是想要提高到90分以上,这么长的生成时间很难通过反复试错去调prompt来生成让自己感觉完美的。感觉只能用同一个prompt然后通过不同的seed去跑一晚上抽卡,然后第二天再全浏览一遍希望能找到一个好的,挺看运气的。

刚刚试了一下这个jetbrains ai用claude agent是真的不行,就算是用了claude sonnet 4.5据说,还是完全没法和别家比,说明coding agent中的模型能力只是一部分,更重要的还是各家的agent设计。

这一周试了一下更多 #vibecoding

首先所有的coding agent都支持自定义模型,包括连接到本地模型,加上agent其实是本地跑的+开源的,所以只要确保模型用的是自己部署的,就能确保数据的安全性,不过自用的话问题不大。

如果是自用考虑性价比:
- 那么
#codex 用chatgpt plus订阅是最好的,量很大,而且效果也不错,大概8分,但是基于CLI,交互差一些。

如果纯粹从效果角度出发:
-
#cursor (每月20USD,但是限制用量也到20+USD,超了就只能用那种mini模型),交互满分,性能9分。
- google
#antigravity (用google的ai订阅,限制用量暂时没试过,free tier的用量比较低,写前端目前最强10分,别的差一些,可能是gemini3pro的特性,一个重大交互升级是能自动用浏览器看前端页面,然后模型读取前端截图来提升前端设计效果,写后端效果一般),交互和curosr一个水平也是满分,写后端的性能综合下来可能是7分。
-
#claude code(每月20USD,但是注意在国内用如果IP地址泄露可能导致封号),CLI简陋的交互但是比codex好一点点,总体性能是很强的,应该是和cursor一个水平9分。
-
#opencode (开源拖拉机,其中想说的是#oh-my-opencode ,拥有这个社区激进的多智能体设计),CLI交互比御三家的cli强很多,但是还是达不到IDE GUI的水平,总体性能如果能用上opus这种sota模型,基本上和cursor一个水平甚至更强(9分),考虑到多智能体一直写,可以做到无托管自己写自己debug一小时。缺点是吃的token比较多,token性价比低。

另外的:
- github
#copilot :设计的不太好,好像上下文限制也较大,主要优势是如果有github教育认证就能一直白嫖订阅,总体性能不及格(5分)。
- jetbrains
#junie :给JB IDE用的coding agent,一开始出的时候试过,基本出于比较糟糕的状态(2分),和模型无关,纯粹是本身设计问题,不知道现在怎么样了。

尝试了一下用图像编辑模型改图,感觉nano banana pro的指令跟随性能远强于别的,但是审查严重,只有本地qwen image edit没这个限制。新的qwen image edit 2511比2509提升还是有的, 但是和nano banana pro比差距还是很大。有个叫作qwen image edit AIO 的模型用起来比加载一堆各种各样的模型更方便。

在不断尝试中,感觉比起不断的试错改prompt从原图生成,不如不断的迭代生成后的图片效率更高。

然后如果想要局部修改一小块区域,用qwen image utils节点去控制修改的mask更方便。

感觉很多时候qwen image edit的指令跟随很难受,可能是受到了训练集的bias影响,经常想要修改一些地方,但是通过文字描述之后,会一起修改一些别的细节,一致性感觉不如nano banana pro。

最近在玩 #mc 的时候想到如果能有一个和 #matrix 桥接的mod就好了,结果只有一个fabric的mod支持新版本,forge的mod只支持非常老的版本。于是就花了一点vibe coding写了一个用于1.18~1.21的forge mod:Minecraft Matrix Bridge (发布页 https://modrinth.com/mod/mc-matrix-bridge, 源代码 https://github.com/ControlNet/minecraft-matrix-bridge)。

@shironeko@fedi.tesaguri.club 是中间宽带那边检修了一次,然后重连出问题了。感觉是系统尝试连外面什么服务,导致整个卡住的,很奇怪,很难复现,之前有几次宽带断的时候都能正常简单自动重连回去。

没想到刚刚放假回家,运行这个实例的NAS就失联了,之前连续运行两年都没什么大问题,结果导致sharkey和matrix都挂了。但是这些都是重量级服务,跑一个就要1G内存,外面的云服务太贵了很难跑。先想办法把一些不依赖本地硬盘的服务都先移到外面的云服务上吧,比如说gethomepage这种。不过好像也就这个,别的要么是依赖本地存储和设备的比如说 jellyfin, ani-rss, home assistant这种,要么是sharkey和matrix这种内存需求太高的。

NAS能否稳定运行真的感觉纯看运气。一个月之后回来看,发现完全系统卡死,只能强行重启。

MBP在更新到MacOS26之后续航血崩,只能坚持两三个小时。最近发现了一个不错的缓解办法,通过launchctl setenv CHROME_HEADLESS 1 可以大幅降低能耗,现在能四五个小时应该问题不大。

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst