重磅!知医邦公开其查体大模型的Token数和算法

八年来,知医邦致力于中医AI化,中医数字化,争取用AI让中医变简单。作为AI中医大模型的先驱,知医邦率先公开其查体大模型的Token数和算法。
一、词元数据
ChatiSS的核心是基于知医邦医院自主标注建立的含有184956个词元(Token)约2亿个拓扑集合计算元素的病证方药数据库,利用平台用户5年约2千万健康数据训练出来的辨证论治大模型。

二、算法模型
A、舌诊模型
四项核心发明专利以数学模型重构中医舌诊体系,将传统经验判断转化为可计算的精密表达,这正是知医邦打造AI舌诊工具的底层逻辑。系统从寒热、虚实、燥湿、亏滞四个维度出发,分肝、心、脾、肺、肾五脏系统,全面解析舌色、舌形、苔质、苔形等特征。通过《基于气血津液数学模型》《舌诊寒热虚实数学模型》《识别苔形苔质数学模型》《舌面轮廓环区域划分数学模型》四项专利,将舌诊中的模糊概念解构为标准化数学表达,使中医诊断从主观经验走向客观量化,以实际行动印证“中医是可计算的”这一理念。例如:寒热指数就可以用公式AVERAGE(SIN((1/2*S-1/2)*π)+SIN(H*π*2)+SIN((V-1/2)*π/3))来计算。

B、脉诊模型
核心发明《一种基于穿戴式脉象仪的标准化脉诊方法及脉诊平台》正式获得国家知识产权局颁发的专利证书。将中医理论中针对28脉,以及纳入大脉、平脉后共30种脉象的特征描述,由文字形式转化为计算机语言和数学模型。脉象仪从脉位、脉数、脉形、脉势四个维度量化“脉感”,通过脉图匹配精准判别脉象类型,并依据海量数据反向校验、优化算法,实现脉诊的标准化与可计算。
C、五运六气模型
阳历公历年转换:if =1月 阳历年数=公历年数-1;if ≠1月 阳历年数=公历年数。
计算方法
根据年份的天干确定五运。
根据地支确定司天之气,进而推出在泉之气。
结合五运和六气的推算结果,分析每年气候的大致变化规律及其对人体健康的影响。
五运六气基于易经,推理运算量十分庞大,以下只是给出了年月运气权重,尚有主客、郁发、胜复等等概念与逻辑不能一一列举。

1.1.五运有余:取总和最大且>4者,如果并列,取对应六气最大者。
1.2.五运不及:取总和最小且<2者,如果并列,取对应六气最小者。
1.3.六气:取气数总和最大者,如果并列,取对应五运最大者。
D、智能问诊模型
1.1.根据用户填写内容拆组词,加上舌诊脉诊五运六气等记录导入词,拆组词需要在词元表“病症”页里面运算一次,完成俗话到行话的转换,得到匹配词元集合[A]
1.2.词元表“病症”页中H列[病侯]外显在身体状态的586条词元集合[G]
1.3.令集合[F]=[恶寒、发热、无汗、多汗……],m=1~20个词元分数都=1+(21-m)/1000
1.4.将集合{[F]+[A]}∩[G]=[E]=[E1、E2......、En]各词{分数[F]+[A]相加}按得分大小列出前20个,供用户选取,得集合[C]
2. 望闻问切1080条词元集合[B],取[C]∩[B]=[D]=[D1、D2......、Dn],如果集合[D]为空集(n=0),则立即结束询问
3. 在词元表“病症”页,将含有集合[D]=[D1+ D2......+ Dn]中所有词元的行,标红
4. 予以全部标红行,统计集合[B]中各词元出现的次数,排除[D1、D2......、Dn],取次数最多的词元的外显选项进行询问
4.1. 如果询问结果为“否”,按4.0.中次数下一位的词元进行询问,如果没有次数下一位的词元,则立即结束询问
4.2. 如果询问结果为“是”,就产生了新的词元[Dn+1],将此词元增加到集合[D]'=[D1、D2......、Dn、Dn+1],用增加后的集合[D]'重复3.--4.2.
4.3. 如果询问结果为“结束回答”,则立即结束询问
E、辨证论治模型
1.1 用户填写:21字。
1.2 拆组词法:先按符号、空格进行拆词,对所得字段按右侧规则再进行一次拆组词,产生一批新词,加入匹配词元。
2 导入词:硬性定义,不参与拆组。
3 匹配计数:没有约定计数=Φ^2;否定症,阳性计数=0,阴性计数=1;其他、阳性计数=1,阴性计数=0;
4 计算词:
4.1 症候、行话 计算症候(症状/病候)、行话=∑俗话计数,
4.2 ≥1,症候(症状/病候)、行话计数=1,加入匹配词元。
4.3 计算症候(症状/病候)、行话=算法B。
4.4 ≥1,症候(症状/病候)、行话计数=1,加入匹配词元。
4.5 证素 计算证素=算法A。
4.6 ≥1,证素计数=1,加入匹配词元。
4.7 证型 计算证型=算法A。
4.8 ≥1,证型计数=1,加入匹配词元。
5 算法:
分数=(A)^{{e^[-LOG10(|n-4|+10)+LOG10(14)]}^4×e^(V/8)/4},if A≤0.01,计为A=0.01;
A=(∝必有+Φ^2)×(∝否定+Φ^2)×{[∑特征/|2×m-1|^(Φ^4)]×Φ^-1+[∑常见/|2×m-1|^(Φ^4)]×Φ^0+[∑一般/|2×m-1|^(Φ^4)]×Φ^1+Φ^4}/(2×Φ^-1)。
F、遣药组方模型
1.1.排除词元表“组方”页BI列(处方剂量)里面为N/A的行,选取查体得分≥1,分数最高的100个方子,作为选出的方子。
1.2.计算选出的方子,每个方子中的药材占比=1/方子的药材数^0.5,统计100个方子里面各药材的药材占比之和=E,取E最大的12个药材,如果出现相同的E,取药材本身查体得分高的,作为为集合[A]=[A1、A2……A12]。
1.3.从集合[A]=[A1、A2……A12]中取药材本身查体得分高的6个药材为集合[B]=[B1、B2……B6]。
2.1. 从选出的方子中挑选出任意两个,假设为α和β,其药材组成集合[C]α和[C]β。
2.2. 将满足条件的两个方子α和β合并为一个新的方子。
2.3. 将这些合方与查体得分最高的100个方子一样,都是目标方子。
3.1. 排除词元表“配药”页BI列里面为N/A的行,选取查体得分≥1,分数最高的10组药对。
3.2. 将目标方子内含有上面10组药对的药对找出来,方子内含药对本身查体得分的平均数=各药对的自身查体得分之和/药对组数^(1/2)。
4.1. 排除词元表“配药”页BI列里面为N/A的行,挑选出药对本身查体得分≥1且其组合药材至少含有集合[B]中的6位药材任意一味且的,再取查体得分最高的1组药对,里面的药材为集合[D]=[D1、D2]or[D1、D2、D3],可能是2味药材或3味药材;
4.2. 找出治法里面带“加X”的查体得分≥1最高的2个治法,其对应药材为集合[X]=[X1、X2];
5. 用[B]去匹配目标方子,F=完全匹配[B]的药材数/(6+方子的药材数-完全匹配[B]的药材数)×方子本身查体得分^2×方子中药材本身查体得分的平均数×方子内含药对本身查体得分的平均数×2^{-[(方子的药材数-6)^2]/12},取F最大的一个方子为基础方,该基础方自身的药材组成集合[C]。
6.1. 将属于集合[D]∪[X]但不属于集合[C]的药材,取2个药材本身查体得分高的,作为加某某。
6.2. 将属于集合[C]但不属于集合[A]∪[D]∪[X]的药材,取1个药材本身查体得分低的,作为减某某;
6.3. 将集合[C]里面的药材符合十八反十九畏的就是触犯了配伍禁忌,将药材本身查体得分低的直接剔除;
6.4. 将集合[C]里面的药材与集合[D]∪[X]里面的药材逐一匹配,符合十八反十九畏的就是触犯了配伍禁忌,将集合[D]∪[X]里面的药材直接剔除:
7.AI处方用药匹配词元表“配药”页BI列里面的剂量就是AI处方,匹配不到剂量的药材自动剔除。
三、结语
为了人类的健康,知医邦声称可以放弃一切权利,专利可以开放,数据可以共享,算法可以公开,代码可以开源,食品工艺可以无偿传授,舌脉象仪可以免费发放。实际上,知医邦一直在实行普惠主义,知医邦已经上线了知医App、汤头App、看舌头App以及查体智能辅助诊疗系统PC版、知医网页版和知医邦医院小程序,软件可任意部署在PC、平板、手机、电视等智能终端,基本上都是免费的。知医邦还将上线一款查体App,作为智能问诊工具软件,用完即走,甚至连用户注册都不需要。知医邦还曾经拿出3000台脉象仪,免费赠予有需要的人们,知医邦医院诊疗项目一直在零加价运营。知医邦正在开发软件接入API接口,由长江日报传媒集团联合武汉市卫生健康委员会打造的武汉首个城市级智慧健康服务平台--咋诊已经接入了知医邦的看舌头API。为中医国际化添砖加瓦,知医邦开发的汤头App国际版“TakeTonic”也即将在硅谷上线。
















