he4o系统
he4o是一个螺旋熵减机,是一种通用人工智能(AGI)系统:
- 机器学习支持:
- 以迁移学习为主
- 以强化学习为辅
- 知识表征宏微支持:
- 稀疏码
- 特征
- 概念
- 时序
- 价值
- 神经网络支持:动态、模糊、抽具象、组与分、感理性。
- 支持智能体自主终身动态学习。
- 无论宏观框架还是微观细节设计,都遵循相对与循环转化原则。
- 思维控制支持:
- 出入 (行为 & 感知) //包含反馈
- 认知 (识别 & 学习) //包含类比
- 需求 (任务 & 计划) //包含意向
- 决策 (求解 & 迁移) //包含分析
- 数理:
- 集合论(迁移)
- 概率论(强化)
- 计算:使用最简单的布尔运算:
类比
和评价
。 - 记忆结构:长时为网(启发式)、短时为树(递归)、瞬时为序(依次)。
- 编程思想:DOP (面向动态编程:知识由后天演化,先天仅编写控制器和存储结构)。
- 性能要求:可运行于单机终端(当前是iOS设备)。
手稿:https://github.com/jiaxiaogang/HELIX_THEORY
网站:https://jiaxiaogang.github.io
文档:https://james4ever0.github.io/he4o 由James4Ever0提供,感谢❤
1. -------------引言-------------
第一梯队:1950年图灵提出"可思考的机器"和"图灵测试",他说:"放眼不远的将来,我们就有很多工作要做";
第二梯队:1956年达特矛斯会议后,明斯基和麦卡锡等许多前辈穷其一生心血,虽然符号主义AI在面对不确定性环境下鲁棒性差,但却为AGI奠定了很多基础。
第三梯队:随着大数据、云计算等成熟,AI迎来DL、GPT热潮,但DL、GPT也并非全功能型智能体。
综上:近70年来,人工智能研究跌宕起伏,但与最初设想的AI还相差甚远,he4o旨在实现螺旋熵减机式的通用人工智能系统。
2. -------------(一)螺旋论-------------
螺旋论从2017年2月正式开始研究至2018年2月成熟,历时一年。
螺旋论:含三大要素:定义、相对和循环,共同呈现螺旋形。 |
---|
https://github.com/jiaxiaogang/HELIX_THEORY#%E7%86%B5%E5%87%8F%E6%9C%BA |
3. -------------(二)螺旋熵减机模型-------------
螺旋熵减机理论模型在18年3月成熟,直至今天此模型仍在不断细化中。
1. 此图从内外双向、动静转化、主客角度,三种方式来解读。 |
2. 每外一个模块,与内所有模块之和相对循环(如神经网络与思维,智能体与现实世界) |
注:一切都是从无到有,相对与循环,he4o认为自己活着源于循环 ; |
4. -------------(三)he4o系统实践-------------
V1.0《初版》:
2017年2月
立项 -2018年10月21日
正式落地发布V1.0版本。
V2.0《小鸟生存演示》:
2018年11月
-至今
开发完成,测试训练中...
架构图 | |
---|---|
架构设计 | 由螺旋论展开成螺旋熵减机模型,再由螺旋熵减机模型展开为系统架构 |
代码占比 | 内核代码中神经网络占30%,思维控制器占50%,其它(输入、输出等)共占20%; |
神经网络 | 神经网络的模型十字总结:横向宏与微,纵向抽具象 ; |
思维向性 | 每一种操作方向表示一种思维操作,如:认知、决策、理性、感性。 |
思维模块 | 1分2分4分8:感知(入),识别(认),学习(知),任务(需),计划(求),求解(决),迁移(策),行为(出) |
思维架构 | 思维控制器整体呈现螺旋形运行 |
5. -------------DEMO演示-------------
1 | 多向飞吃 |
---|---|
说明 | 在这个DEMO中,它已通过交互学习,知道饿了吃坚果可以解决饥饿问题,也通过交互学习到飞行可以解决距离问题,在扔出坚果后,它会自行飞过去吃掉以解决饥饿问题; |
操作 | 在这个DEMO中,我投喂了两个坚果,并且点击了模拟饥饿(因为等手机掉电太慢了,很多时候我用模拟器跑,更不会掉电),别的都是它自己行为; |
2 | 安全第一 |
--- | --- |
说明 | 在这个演示中,它之前被撞了一次,导致后来一看到飞来的木棒就立即躲开,并且不再飞到下面,即使扔坚果它也不去吃; |
操作 | 我可以用双击向下拉它,但它自己会立即躲上去,我也可以手动投喂坚果,但它仍会自己躲开不过去; |
3 | 变向觅食 |
---|---|
说明 | 在这个演示中,它会自动尝试飞到坚果处并吃掉,但当它离得很近时尝试吃却没吃到,然后又思考了一下,再飞近,才吃到坚果; |
操作 | 在这个演示中,我扔了坚果,点击了模拟饥饿,其他都是它自己的思考和行为; |
4 | 先躲再吃 |
---|---|
说明 | 在这个演示中,它在饥饿后准确去吃,但此时看到木棒,立即又躲回来,等到木棒过去安全后,又飞上去吃坚果; |
操作 | 坚果是我扔的,饥饿是我点的,木棒是我扔的,其他都是它自己的行为; |
5 | 初用工具 |
---|---|
说明 | 在这个演示中,它可以通过踢的行为将带皮的坚果踢到路上,等木棍滚过压破皮后(初级使用工具功能),它再飞过去吃掉; |
操作 | 带皮坚果是我扔的,饥饿是我点的,木棒是我扔的,其他都是它自己的行为; |
6. -------------付费声明-------------
付费:本软件是付费软件,分为使用付费和商业付费两个部分:
-
使用付费的价格=需每年支付使用者平均一顿午餐的费用进行支付。 如果使用者的收入低于所在城市(地区)平均收入,则无需支付该项。
-
商业付费的价格=该软件为基础创造的商业营收的0.1%进行支付。 如未创造营收,则无需支付该项。
打赏:您也可以对我进行打赏,以帮助我有更多资金与精力投入到该系统的研发,非常感谢。
7. -------------时间线-------------
2024.08.09
至今
- 综合训练:
连续飞躲 & 连续踢搬运 & 连续觅食
2024.07.20
耗时19天
- 回测训练:
训练用搬运
、微调:多触发Canset类比抽象
2024.07.20
耗时19天
- 回测训练:
训练用搬运
、微调:多触发Canset类比抽象
2024.07.06
耗时14天
- 迭代TCPlanV2 & 连续视觉:
训练用搬运(失败)
、迭代TCPlanV2
、训练用搬运(成功但不稳定)
、连续视觉
2024.05.25
耗时40天
- 回测训练:
测试
、支持OutSPDic
、训练无皮果动机ok
、训练Canset试错训练ok
、训练学去皮ok
、训练有皮果动机ok
、微调:持续价值感的任务的失效机制调整为-负mv反馈后任务不失效
、训练学搬运
2024.05.10
耗时15天
- Canset的传染机制:
Canset的传染机制:批量判断否和批量唤醒
2024.04.25
耗时15天
- 测训&修细节:
概念识别BUG导致feedbackTOR不成立
、迭代convert2RCansetModel()算法:1.优化条件满足判断 2.候选池宽入100%激活
2024.04.10
耗时15天
- Canset的IndexDic:
HCanset的IndexDic收集与计算
2024.03.12
耗时28天
- 训练测试:
回测实时竞争和HSolutionV3
2024.02.15
耗时25天
- 迭代hSolutionV3:
迭代hSolutionV3
、迭代迁移:综合indexDic计算 & 推举继承合并
2024.01.10
耗时25天
- 解决方案实时竞争:
支持持续反馈 & 持续反馈评价
、Cansets实时竞争
、迭代TCPlanV2
2023.12.28
耗时12天
- 搬运训练:
搬运动机训练
、学会搬运
、运用搬运
、Root竞争进度分加权
、hCanset迁移优化:基于r场景树和hAlg抽具象树实现迁移
2023.11.09
耗时49天
- 搬运训练:
搬运动机训练
、交层Canset训练
、规划搬运训练步骤
、迁移时连带迁移SP值
、构建Canset改为场景内防重
、同质任务执行太多次问题:同质Root合并
、决策性能优化(15s至1s)
2023.10.17
耗时22天
- 去皮训练:
整理Canset演化过程
、废弃Canset识别类比
、加重Canset预想与实际类比
、全面支持cansetAlg的共同抽象即匹配
、预想与实际类比中的实际fo:采用pFo.realMaskFo生成
2023.09.07
耗时40天
- 去皮训练:
H任务支持TCScene & TCCanset & TCTransfer
、HCanset由R场景改为单独场景
、优化去皮训练步骤
2023.08.16
耗时20天
- 去皮训练:
学会去皮
、训练步骤设计与实施
2023.07.30
耗时17天
- 去皮训练:
去皮动机
2023.07.16
耗时14天 其中测试7天
- 多线程思维:
思维用TI和TO两个线程
、回归测训
2023.06.29
耗时17天
- 测试父子任务:
迭代TCRefrection反思:改到行为化前
、反思识别二次过滤器
2023.06.01
耗时28天
- 防撞和觅食训练,等安全再吃训练:
性能优化
、防撞训练完成
、觅食训练完成
、防撞觅食联合训练完成
、持续饥饿感
2023.05.25
耗时7天
- 识别准确度提升:
识别二次过滤器
2023.05.07
耗时18天
- 回测Solution数据流竞争演化情况:
训练测试稳定的场景演化过程
、迭代solutionFoRank排名器
2023.05.03
耗时4天
- 梳理TO数据流:
Solution竞争断层:宽入窄出
、solutionCanset过滤器
、solutionScene过滤器
2023.04.20
耗时12天
- Canset迁移性增强回测:
修复canset迁移后支持indexDic等错误
2023.04.02
耗时18天
- 提升Canset迁移性决策部分:
Canset迁移性增强的决策支持
、TCScene场景树
、TCCanset.override算法
、TCRealact可行性
、TCTransfer推举和继承算法
、相应更新SPEFF
2023.03.21
耗时11天
- 提升Canset迁移性认知部分:
外类比支持匹配度共同点
、构建新Canset优先用场景算法
、迭代Canst识别和全含判断
、Canst外类比
、Canst空概念
、抽象Canset初始SPEFF
、Canset识别支持AIFilter
、回测Canset迁移性
2023.03.09
耗时12天
- 训练:
觅食和防撞训练
、特征主观恒常性
、Canset惰性期
、测得Canset迁移性差问题
2023.02.26
耗时13天
- 优化:
测决策循环连续飞躲
、反思子任务不求解
、修复行为转任务死循环错误
、修复静默任务被激活错误
、调整过滤器提升识别准确度
、觅食训练规划:移动进时序(未完成)
、增加迁移性与识别准确度:废除客观特征
2023.02.14
耗时12天
- 优化:
使取S越来越准
、修复识别率低错误
、支持AIFilter过滤器
2023.02.04
耗时10天
- 回测:
测试条件满足功能
、回测项大整理
、修复R任务的Canset再类比时机与条件判断错误
2023.01.03
耗时12天(含测试12天,中途春节休7天)
- 优化:
迭代canset前段条件满足
、使概念识别越来越准
、修复前段条件满足不完全的问题
2022.12.17
耗时16天
- AIRank:
概念识别和时序识别的综合竞争:支持强度竞争
、回测
2022.11.30
耗时17天
- 二十测:
回归测试
2022.10.15
耗时45天
- 优化:
抽具象多层多样性优化
、持久化与复用概念相似度
、迭代时序识别:持久化与复用indexDic
、canset演化周期
、废除TO反思识别
2022.10.08
耗时7天
- 测试:
废弃isMem
、继续测试反思
2022.09.18
耗时12天
- 测试:
测试任务失效机制
2022.09.01
耗时17天
- 调优:
任务失效机制
2022.08.06
耗时25天
- 测试:
测试TCRefrection
、性能优化
2022.07.05
耗时22天 中途旅游休8天
- 十九测:
迭代TCRefrection反思
2022.06.05
耗时9天 中途疫情休20天
- 梳理TC数据流:
决策配置调整:快慢思考部分
、学时统计和用时概率
、测连续飞躲
、Analyst综合排名
2022.05.20
耗时15天
- 梳理TC数据流:
识别准确度优化:逐层宽入窄出
、数据流:整体观
、快思考慢思考
、TCActYes每帧O反省
2022.05.11
耗时9天
- 性能优化:
优化pFo识别性能
、迭代Demand支持多pFos
、十八测回归测试
2022.05.04
耗时7天
- 工具优化:
十七测
、强化训练工具优化:支持模拟重启
、思维可视化工具优化:支持手势缩放
2022.04.28
耗时6天
- 梳理TC数据流:
整体兼顾
、各线竞争
2022.04.23
耗时5天
- 十六测:
性能优化
、强化学习训练
2022.03.28
耗时8天 中途疫情休17天
- 强化训练:
开发强化学习稳定性训练器:RLTrainer
2022.03.13
耗时15天
- 思维可视化工具:
TOMVisionV2迭代:思维可视化
2022.02.16
耗时25天 中途春节疫情休25天
- 十五测:
春节结束,开工回归测试
2022.01.15
耗时5天
- 十四测:
回测相近匹配
2022.01.10
耗时5天
- 相近匹配:
相近匹配
2021.12.26
耗时15天
- 回归十三测:
新螺旋架构测试
、反省分裂迭代测试
2021.12.22
耗时4天
- 反省迭代:
hSolution从SP取解决方案
、分裂:感性反省和理性反省
、废弃HN
2021.11.18
耗时34天
- 思维控制器架构大迭代:
完善螺旋架构
、废弃宏微决策
、反思融入识别
、工作记忆树迭代
、迭代综合评价
、末枝最优路径
2021.11.04
耗时14天
- R决策模式迭代:
FRS评价器迭代
、废弃dsFo
、废弃PM
、废弃GL
2021年10月19日
耗时15天
- PM稳定性迭代:
VRS评价器迭代
、VRSTarget修正目标
2021年9月29日
耗时20天
- v2.0第十二次测试与训练:
IRT的SP参与VRS评分
、SP定义由顺逆改为好坏
、紧急状态不反思
、主客观互卡问题
、tir_OPushM迭代:IRT的理性失效
2021年9月14日
耗时15天
- 网络节点类型排查:
指针集成type
、自检测试
、网络at&ds&type错误大排查
2021年7月8日
耗时66天
- v2.0第十一次测试与训练:
子任务回测
、R决策模式
、防撞训练
2021年6月25日
耗时13天
- 子任务细节改动:
子任务的已发生截点
、同级任务协作
2021年6月5日
耗时17天
- 子任务细节改动:
子任务协同
、子任务不应期
2021年5月24日
耗时1个月
- v2.0第十次测试与训练:
子任务测试
、防撞训练
2021年4月10日
耗时44天
- v2.0第九次测试与训练:
觅食训练&变向觅食训练
2021年4月7日
耗时15天
- HNGL嵌套迭代:
内中外类比迭代v3,v4
、迭代getInnerV3()
、RFo抽具象关联
2021年3月12日
耗时20天
- v2.0第八次测试与训练:
R-模式测试
、觅食和防撞融合训练
2021年2月23日
耗时37天
- 决策理性迭代:
规划决策
、子任务迭代:理性反思
、来得及评价
、嵌套关联
2021年1月30日
耗时4天
- R-决策模式V3迭代、反向反馈外类比
2021年1月23日
耗时35天
- v2.0第七次测试与训练
防撞训练
、R-模式测试
2021年1月15日
耗时8天
- In反省类比迭代、R-决策模式V2迭代
迭代触发机制: 生物钟触发器
2020年12月24日
耗时20天
- v2.0第六次测试与训练
多向飞行正常
2020年12月7日
耗时1个月
- AIScore评价器整理完善:
时序理性评价:FRS
、稀疏码理性评价:VRS
2020年11月7日
耗时1个月
- v2.0第五次测试与训练
2020年10月21日
耗时15天
- TIR_Alg支持多识别
2020年9月1日
耗时1个月
- v2.0第四次测试与训练
2020年8月12日
耗时27天
- Out反省类比迭代 (DiffAnalogy)、生物钟(AITime)、PM理性评价迭代v2
2020年6月28日
5天
- 决策迭代:PM理性评价
2020年6月6日
耗时2个月
- v2.0第三次测试与训练
2020年5月15日
耗时20天
- 决策迭代:(根据
输出期短时记忆
使决策递归与外循环更好协作)
2020年4月21日
耗时1个月
- 决策迭代:(根据
输入期短时记忆
使决策支持四模式)
2020年3月31日
耗时1个月
- 迭代外类比: 新增反向反馈类比 (In反省类比) (构建SP正负时序、应用SP于决策的MC中、迭代反思)
2020年2月20日
耗时18天
- 稀疏码模糊匹配
2019年12月27日
持续3个月
- v2.0第二次测试与规划性训练--回归小鸟训练
2019年11月22日
耗时1个月
- 理性思维——反思评价
2019年9月30日
耗时2个月
- 理性思维——TOR迭代 (行为化架构迭代、支持瞬时网络)
2019年8月25日
耗时1个月
- 理性思维——TIR迭代 (时序识别、时序预测、价值预判)
2019年6月20日
耗时2个月
- v2.0版本基础测试改BUG 与 训练
2019年6月5日
写完耗时15天,调至可用性达到标准至45天
- v2.0第一次测试--小鸟训练——神经网络可视化v2.0
2019年5月1日
耗时1个月
- 优化性能——
XGWedis异步持久化
和短时内存网络
2019年3月1日
耗时2个月
- 内类比 (与外类比相对)
2019年1月21日
耗时40天
- 迭代决策循环 (行为化等)
2018年11月28日
耗时2个月
- 迭代神经网络 (区分动态时序与静态概念)
2018年11月5日
规划耗时20天
- 势 (小鸟生存演示) (v2.0开始开发)
2018年10月21日
耗时0天
- v1.0.0 (he4o内核发布)
2018年10月20日
耗时0天
- 螺旋熵减机 (产生智能的环境)
2018年8月29日
耗时2个月
- MOL
2018年8月1日
耗时1个月
- MIL & MOL (重构中层动循环)
2018年7月1日
耗时1个月
- HELIX (定义、相对和循环呈现的螺旋型)
2018年6月1日
耗时1个月
- 三层循环大改版 (mv循环,思维网络循环,智能体与现实世界循环)
2018年5月1日
耗时1个月
- 相对 (he4o实现定义,横向相对,纵向相对)
2018年2月1日
耗时3个月
- 宏微 (前身是拆分与整合,宏微一体)
2017年12月9日
耗时2个月
- 定义 (从0到1)
2017年11月10日
耗时1个月
- 规则 (最简)
2017年9月20日
耗时50天
- DOP_面向数据编程
- GNOP_动态构建网络
2017年8月23日
耗时1个月
- 神经网络 (算法,抽具象网络)
2017年8月2日
耗时20天
- MindValue(价值)
2017年7月10日
耗时20天
- 树BrainTree(参考N3P7,N3P8)
2017年6月1日
耗时40天
- 三维架构(参考笔记/AI/框架)
2017年5月22日
耗时10天
- OOP编程思想->数据语言 (OOP2DataLanguage)
2017.05.21
耗时1天
- 重绘了新版架构图; (AIFoundation)
2017.04.21
耗时1个月
- 金字塔架构
2017.03.21
耗时1个月
- 分层架构
2017.02.21
耗时1个月
- 流程架构