跳到主要內容

醫學健康跨領域合作的開始:資料工程





一直都很喜歡在會議上與跨領域的專家、醫師、學者分享我們在數據工程與分析應用上的發展經驗。
許多的專家學者,對於大數據應用的認知都仍侷限在一個超大型結構化資料集的子集合應用,在規劃好的條件設定下,針對特定的目標(疾病、行為)進行篩選,將數據narrow down到可以被個人電腦或是單一伺服器架構處理的小型資料集。
這樣的半手工處理方式,對於專一(Specific)領域主題的資料追蹤計算或許已經十分足夠,但當中倘若資料清理方式有改變、篩選條件增減,所有的數據都要從raw重新處理,不僅造成大量的時間與人力浪費,對於專案計畫進度的延宕更是麻煩。這些還不包含
結構化、非結構化(影像、訊號)與半結構化(Genomic)的異質資料整合處理,模型的建構與訓練驗證,以及更困難的即時(Realtime)巨量資料處理。
在當今的醫療健康領域中,基礎研究(Basic research)的重要性是無法取代的,但對於基礎研究到應用科學(Applied Science)研究的橋接,如何將研究成果整合到前端的服務應用,或是建立即時分析預測模型、並且整合到前端互動媒介,無可避免的這些都仰賴高度的IT與數據技術導入才能得以實現。
在這個充滿需求、機會的環境裡,正是資訊人、工程師、資料科學家揮灑長才與肝功能的美好世代,恭喜了!
至於個人隱私保護、病人資料不離院前提下如何發展雲端與巨量資料應用,那又是另一個故事與戰場了。
PAN
2017.12.24

留言

  1. HI
    我偷偷告訴你喔
    雖然我感覺您的文章很少人看與迴響

    但您大部份的想法我完全讚同喔,俱正面,而且富有經驗。
    能說善道,又不偏不倚~

    雖然文章是可以修飾的,有些人交談上與寫作是完全不同的。


    我是個患有罕見疾病的先天患者
    基因使然,害我有多重複合症,其中之一就是 "肌肉萎縮 " 啊。

    這讓我吃足苦頭,讓我幾乎是個宅男,外食、出國、出門都在個位數啊。
    頭腦也不好,估計也跟心肺有關或疾病有關吧。

    不知不覺就30了...
    沒學歷、沒肌肉、沒智力的我大概只能一直領低薪下去吧。
    看一本書,看10頁忘10頁。
    數學也不行,到X+Y就掛了,更不用提維基分。

    有VB基礎,也懂得搞office.vba。
    也頂多拿來做做行政用途罷了。

    想要出門創業,全身都沒力量,電腦輪椅最長距離只有15K。

    與人聊天,記不起來對方說什麼。
    也當不起領導人

    粗工不能做、設計有障礙、帶領沒閱歷。
    汒汒然就點到你的文章來看了 ~

    親戚看不起、朋友沒半個、找不到東西累積實力,身體狀況還越來越差。
    因為全身沒肌肉的關係,導致我的肝與腎又要負責全部的代謝。
    有一點肝硬化了

    血糖開始高了。

    人生啊,真的很慘 ~
    現在像個吸血蟲一樣,趴在一個名為台灣的病人上。

    我最近也才去理解一下ERP而已,卻不懂什麼BPR'BPM。

    不管是你說的 " 嘴巴吃垃圾 " or " 獲利的點子 " or " 負能量 " or 什麼 ~
    我真的這陣子全都體會過了

    因為身體整天被關在家的我該感到欣慰嘛?
    最近真的不順到已經開始懷疑自已的生存意義了。

    謝謝你的分享喔,我想~ 我的基因如果能正常一點,大概會走跟你一樣的路吧。


    只會出一張嘴的上司,正事都不做,專業能力不足。
    會耍心機的同事,不儘會奉承,還會搞很多小動作。

    以及儘管你的條件很差,差到極點,都還會陪你聊聊講講話的朋友,雖然他們很忙。

    以及隔著電腦來認識這個世界的我
    那些網頁語言、ERP、進銷存、UIPATH、AI、物聯網

    回覆刪除
  2. bons casino bonus code "BONUS" for December 2021
    bons casino bonus code "BONUS" for December 2021. New bet365 players get a $250 bonus on the first deposit. bons casino welcome ボンズ カジノ bonus. Rating: 90% · ‎Review by bet365 Casinoinjapan.com

    回覆刪除

張貼留言

這個網誌中的熱門文章

Google 資料庫方案–Spreadsheet–(1)資料呈現

HEMiDEMi 的標籤: Google , Google SpreadSheet , 雲端 早在規劃『 教育,意義! 』project時, 便有打算將整個網站建立過程撰寫一篇教學,讓有興趣以google 服務為基礎進行開發的朋友參考。 沒想到這個想法擺著就拖了好幾個月, 好在學生提出了問題,就趁這機會寫一寫吧。 基本上『 教育,意義! 』網站的架構完全建立在Google提供的服務, 廣義來說也是個雲端的系統, 所有的資料是分散在不同的服務架構下,再用GAE, Javascrript將服務資訊串接起來, 由Blogspot 統一呈現。 省了租主機的費用,或架站的硬體、電費, 最好的地方在於不用管理主機維運的問題, 只要專心做我的創意、嘗鮮就好了!!   多棒! 若將『 教育,意義! 』網站依功能層次來分類,可以分為三層結構, 當中的層次與使用技術大致如下: UI 介面層 服務 : Blogspot (網站介面) , Picasa (相簿空間), Google Apps 技術 : Javascript , AJAX ( JQuery ) App應用層  服務 : Google App Engine (GAE) 技術 : Java, Java Server Page (JSP) 資料層 服務 : Google Docs (文件), Google Spreadsheet (試算表) 技術/函式庫 : Java, Google Data APIs 本篇文章將著重在介紹以Google Spreadsheet 做為雲端資料庫, 其他主題將會陸續推出。 若對Google API 與 Google App Engine 初步建置有興趣, 可以參考之前文章: 佛心來著的 Google Data API – for JAVA 雲端的開始:Netbeans 無痛 Google App Engine Java 服務開發 Google Spreadsheet 做為資料庫系統 對於小型的資料系統來說, 採用Google Spreadsheet做為應用程式資料庫(如問卷調查或線上系統) 也算堪用, 目前的儲存限制為 : 40 萬個儲存格 每張工作表最多...

歡迎引戰的Threads演算法機制

  最近受到江老師 江振維的啟發,開始測試Threads的演算法機制,發現它驚人的傳播速度 先講成果,一篇thread文: 第17小時,10,689瀏覽,106則回覆 第24小時,22,122瀏覽,179則回覆  帳號追蹤數僅104位  簡單來說,Threads的機制跟過去Facebook大多鎖定在親朋好友社交網絡之間的內容不一樣,它會大量收集有相關興趣的人來觸及,內容散亂主題分散觸及效果越差,但太過專業不是一般人能理解的效果會更差,所以主題明確直白淺顯易懂,可以快速激發討論的內容,就是容易被擴散的。 這次實驗做了一個策略,文章很簡單,短短三行: 『小朋友為什麼不能學ai?  學生交作業為什麼不能用ai?  為什麼要阻礙進化?』 (文章連結) 策略設計 用爭議性內容(Controversial topics)並參考坎寧安定律(Cunningham's Law)方式,讓主題有開放性討論(疑問句、ai)、敏感性主題(小朋友、學生),最後錨定一個負面且帶有爭議性的價值論述 (阻礙進化),來引發討論 每一個回文,都按愛心 回覆一人只回一次,不深追討論 回覆時回疑問句(諷刺、引戰),但不評斷價值 結果~~ 碰🔥  快速大量瀏覽以及對立式發言,中午時刻短短三小時擴增5000人瀏覽,當回覆互動增加時,會在一個短時間內快速吸人進來討論,直到24小時後觸及就自動下降幾乎歸零。 對比前後實驗的發文,專業文、分享文,效果都非常有限。 可以了解,在這樣同溫特化以及互動至上的平台,"引戰"對於流量製造的效果非常好,但是否能產生導流效果,不得而知,未來可以再嘗試☕ 最後,我自己還是不喜歡這種操作, 認真看待事物、追求專業、理想與和諧,這種人格特質,對於製造混亂、誘發對立討論,雖然還是可以引導教育意義,但互動過於浪費時間、缺少實質回饋、仇恨言論造成心理疙瘩,這都是自己不喜歡的特性😅 還是留給有心理素質的人去玩吧! XD PAN 20240704 Reference Berger, J., & Milkman, K. L. (2012). What Makes Online Content Viral? "Content that evokes high-arousal emotions such as awe, anger, and anxiet...