從大數據到AI,柯林布瑞如何打造醫療大腦
數據已成為當今世界核心經濟資源和基本生產要素,我國也對此作出了相應的部署。2020年4月發布的《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》中首次將數據作為一種新型生產要素寫入文件中,與土地、勞動力、資本、技術等傳統要素并列。
2021年11月25日,上海數據交易所正式成立,將聚焦數據交易確權難、定價難、互信難、入場難和監管難等關鍵共性難題,推進數據權屬界定、開放共享、交易流通、監督管理等標準制定和系統建設。
盡管醫療健康數據所蘊含的巨大價值被行業公認,但其并未包含在首批交易的數據類型中。一大原因是目前的數據交易還處于初期探索階段;另外一方面,我國的醫療健康數據在可利用性上具有巨大的改善空間。為此,國內醫療健康數據相關行業正用實際行動努力挖掘數據價值。以醫療大數據頭部企業柯林布瑞為例,已通過“大數據+人工智能”的解決方案充分發揮數據價值,為醫療機構賦能。
為什么柯林布瑞大數據+人工智能具有先天優勢?
通常而言,醫療人工智能利用深度學習處理影像和文本兩類數據。盡管前者在資本市場較為火熱且技術更成熟,但從應用場景而言,以電子病歷、處方等為主的文本類數據無處不在,并已經廣泛應用于醫療信息化系統。
對于文本類數據,行業一般通過構建知識圖譜,開發自然語義處理(NLP)技術,應用人工智能自動識別、填充、監督、修正、分析文本類數據。隨著技術的逐漸成熟,行業也在探索利用文本數據為醫生提供輔助診斷支撐。
通過將散落在醫療信息化系統的原始數據進行整合并處理為研究和臨床可用的標準化結構化數據,結合專家的寶貴知識和經驗,人工智能企業將這些要素沉淀到算法上打造出疾病模型,乃至進一步的疾病專病庫和疾病研究網絡。以此為基礎的人工智能可以支持醫學研究、臨床診斷治療和醫院運營管理。
不難看出,人工智能的本質是一種數據處理工具,需要大量數據支撐機器學習。因此,與其作用完全匹配的醫療大數據在2016年時便已初具規模。
不過,并非所有的數據都可以用于機器學習。恰恰相反,人工智能學習對于數據有較高的要求。由于歷史和習慣等原因,我國醫學“重臨床、輕數據”的現象比較普遍,醫療數據呈現出數量大、質量差的特征,缺乏統一標準,醫療機構間數據孤島等問題,在很大程度上滯后了健康醫療大數據的發展。
柯林布瑞聯合創始人秦曉宏認為,要將現有的醫療大數據成功地應用到人工智能上存在幾個難點。
首先,現有醫療數據的源數據量很大,可以達到PB級別,但是數據規范程度存在較大的問題。第一是數據結構不規范。由于缺乏相應的強制性標準,每個廠商和醫院的數據結構都不太一致。第二是數據內容不規范。由于缺乏統一的模板,不同醫院的醫生乃至同一醫院的醫生在書寫病歷時對同一疾病可能有不同的描述。
舉例而言,一級高血壓的“一級”在實際書寫中可能還會有“1級”“Ⅰ級”等不同的描述方式。人類可以輕松將這些不同的表達方式歸為一類,又或者在特定的條件下分為不同類;但機器學習則無法對此進行分辨,需要在數據端就加以處理。
其次,我國醫療行業在快速發展的同時,各醫院間、科室間數據孤島現象嚴重,使得健康醫療數據的利用困難重重。盡管國家也在著手解決這一問題,但完全解決仍需時日。
最后,醫學是一個具有較高專業性的領域。即使具有數據治理能力,但缺乏相應的醫學背景,要想將這些數據加以利用,并進一步賦能臨床或者研究,幾乎是天方夜譚。
不難看出,將醫療大數據與人工智能成功結合具有較高的準入門檻,需要大數據企業不單具有數據挖掘能力,還需要具有深厚的數據分析和治理能力,并能理解醫學行業特點和需求。在這方面,作為“醫療大數據+人工智能”探索者的柯林布瑞有著天然的優勢。
在對醫療大數據的長期治理過程中,柯林布瑞對不標準的數據進行標準化映射處理、對非結構化進行后結構化處理、對臟數據進行清洗處理,構建起龐大的醫療行業標準庫和醫學術語庫;從而解決了數據質量問題。
目前,包括華西醫院、瑞金醫院、海軍軍醫大學第一附屬醫院、陸軍軍醫大學西南醫院、復旦大學附屬腫瘤醫院和上海市精神衛生中心等權威三甲醫院都選擇了柯林布瑞合作構建醫療大數據治理平臺與應用平臺,并對其評價頗高。
柯林布瑞的三大數據中心產品布局
為了打通醫院內部的數據孤島,柯林布瑞通過持續的研發攻關和經驗積累,打造出ClinData數據中臺產品并在實踐中多次迭代。即使相應HIS、EMR信息系統未開放接口,柯林布瑞也可以無需任何接口改造就可以無縫把一家醫院數十個廠家數百套系統的數據整合到統一的數據中臺上來,實現了醫院內部“數據孤島”的連通。
此外,柯林布瑞在醫療行業有著多年的沉淀,并建立了規模龐大的專業醫療團隊。這些醫學專業的人才已與數據開發人員形成了默契,能夠互相配合完成臨床專業數據的提取和處理。
柯林布瑞如何將大數據+人工智能為醫院賦能
目前,柯林布瑞已經在自然語言處理、知識圖譜、文字識別、自動化機器學習和臨床決策系統等細分領域上進行了相應的布局,并在罕見病臨床決策和VTE智能防治管理等方面為醫院賦能。
VTE智能防治管理平臺
靜脈血栓栓塞癥(VTE)是指靜脈內血液斑塊形成、脫落并進入血液循環形成栓塞的癥狀。其中,一部分栓塞會進入肺部導致潛在性的致命性肺栓塞。醫院內致死性肺栓塞的發生,已構成醫療質量和安全的潛在風險,成為臨床醫務人員和醫院管理者面臨的嚴峻問題。臨床上諸多科室的患者均存在VTE風險,其發病隱匿、臨床癥狀不典型,容易誤診、漏診。一旦發生致死和致殘率高。
然而,VTE又是一種可預防的疾病,積極有效的預防可以顯著降低其發生率,規范診斷與治療可以顯著降低其病死率。但是目前在臨床實踐中VTE預防現狀并不樂觀。為了加強VTE院內綜合防治能力,并提高各科室醫務人員對VTE嚴重性的認知。柯林布瑞打造了VTE智能防治管理平臺。
這一平臺利用醫院大數據中臺及AI模型,提供高質量決策依據;通過提供標準+定制化評估量表,結合AI全自動決策引擎對病情進行評估及診療推薦,通過醫護輔助診療系統、診療質控管理系統、患者宣教隨訪系統對VTE防治進行全流程管理。
柯林布瑞VTE智能防治管理平臺
它通過三級預防體系來多維度提高VTE防治管理質量。首先,結合自動篩查VTE相關危險因素,警示患者存在的VTE風險,針對病因建立一級預防,降低VTE發病率;其次,設立二級預防動態監測體系,早期識別高危人群并及時通知醫生采取適當干預措施,進一步降低VTE發病率;最后,依據風險評估結果規范VTE預防治療路徑,實施三級預防,防止病情進一步發展和惡化,提高患者生存質量,延長壽命,降低病死率。
通過引入柯林布瑞VTE智能防防治管理平臺,各大醫院患者實現VTE住院全流程全自動評估,平均每位患者VTE評估管理節省醫護人員4個小時工作量,VTE風險評估率從46.14%提高到93.22%,評估模式由單次患者評估轉變為住院全程評估?;颊叩钠骄≡嘿M用減少一半。此外,平臺還可實時識別高?;颊咧鲃犹嵝?,使醫護人員及時發現中高危風險患者知曉率由原來的無數據支撐提高至100%。
罕見病智能決策支持系統
罕見病臨床決策支持系統則是柯林布瑞人工智能底層技術綜合應用的最新探索,包含了罕見病決策交互系統、疾病表型分析系統和罕見病決策引擎。它為罕見病診療提供機會,用于臨床表型、疾病知識等信息的綜合評估,并給出潛在罕見病的候選列表。其主要功能在于綜合患者的疾病表型,對照已有的7000多種罕見病進行評估打分,輔助臨床醫師準確診斷。
一方面,知識圖譜具有海量疾病信息的高效存儲、管理和訪問能力,方便臨床醫師快速檢索和查詢已知罕見病及其研究進展;另一方面,得益于人工智能算法模型的進步,罕見病臨床智能輔助決策引擎可以快速綜合、歸檔、識別和辨別罕見病所需信息,對患者癥狀進行初步評估,減少了臨床醫師重復煩瑣的工作,以便其將更多精力分配到遺傳病的辨別、診斷和治療中。
柯林布瑞罕見病決策支持系統在技術上實現了創新,可將多種知識圖譜對應概念的中文術語統一映射及擴展;并將臨床慣用描述映射至疾病表型標準概念之上。隨后,通過多種相似度算法,通過表型計算任意兩個病種間的相似度,可用于疾病鑒別診斷。如果采集到一個全新病例的表型分布后,則可計算其在知識圖譜中與各個罕見病的相似程度,并提示可能的罕見病診斷。
此外,該系統還可以圖表方式直觀展現醫院罕見病,并可快速歸檔不同類型的罕見病和它的信息,幫助醫生快速進行科研工作。
寫在最后
如何以人工智能、大數據等技術應用的探索輔助未來醫學發展,提升人類醫療健康水平是國家戰略的重點。為此,國家不斷出臺相關政策,不斷完善相應的頂層設計。正因為此,“醫療大數據”在近年來持續火熱。“得數據者得天下”已經成為行業共識,柯林布瑞花了9年時間打造了國內領先的“ClinBrain數據大腦”。
通過在醫療大數據領域的深耕,柯林布瑞已形成“大數據+人工智能”的競爭壁壘,未來,柯林布瑞將探索實踐更多如VTE和罕見病智能決策支持系統等醫療應用場景,提升科研和臨床質量,助力醫療數據應用發展,為醫療行業提供數據智能化支持,最終將打造服務醫療全場景的“ClinBrain醫療大腦”。
