由于我已经一个web应用的harness的成功案例了,我想着可以基于该案例进行再往上抽象一层,构建一个harness的harness,目前我暂时命名HarnessPipeline。
本来是想命名为OpenHarness的,但是这个名字在github上已经有了,而且该作用与我想做的并不一样,为了避免理解冲突,就不重复了。
HarnessPipeline,我的初步想法是这样的:
- harness是基于领域区分的,比如web应用、三维空间、游戏等,这些harness肯定是截然不同的,所以这是第一区分维度
- harness的验证应该具有各自领域的验证器的,比如web应用领域的是playwright主流点,其它领域我还不了解,所以想着这一步,由智能体解决,或者将来添加skill来解决
目前我的想法就这么多,还在做self-play,邀请佬们与我共建,有想法一起讨论。
1 个帖子 - 1 位参与者