跳到主要內容

科學研究的條件與定義

 R0015716
最近,
在許多透過基因體研究探討自閉症候群(Autism Spectrum Disorder, ASD)的論文中發現了一些疑點,
即針對這樣複雜的疾病症狀群,以粗略的未分級資料是否能得知基因間確切的調控關係???
沒想到這樣的困惑,竟是國外自閉症研究上爭論已久的一個議題,

如專欄作家  Lisa Jo Rudy 在   http://autism.about.com  上的幾篇文章:

  • Autism Controversies Fueled by the "Spectrum?" Share Your Opinion
  • Symptoms of Autism NOT Listed in the Diagnostic Literature


雖然這個例子舉的是ASD,
但這也突顯出科學研究上一個主觀性研究的缺憾,
即當一個病症無法明確歸類與分級,便全部冠以相同的分類層級並予以處置,
這點,無疑是剝奪病人的權益並造成錯誤的指導方針。

就像不同層級的ASD病患,
在目前學術醫療分類上僅以患者行為特徵做為分類, 如缺乏社交能力、有限興趣、重覆行為、或缺乏想像力等等 
(事實上許多ASD個案卻都擁有出色的創意思考能力)

這些行為分類都可以在目前最普遍使用由美國精神醫學為會American Psychiatric Association) 所出版的:
神疾病診斷與統計手冊,第四版(The Diagnostic and Statistical Manual, Fourth Edition (DSM-IV) 中瞭解。

然而這樣的分類特徵明顯缺乏疾病分類上應有的準確性與覆蓋度,
以ASD患者為例,如同Lisa Jo Rudy所提到許多病患時常遭受到的個體症狀,如:
腹瀉、胃痙攣、焦慮、癲癇與敏感症狀等等常見特徵,都未被囊括討論於手冊的分類項目中。
然而,這樣的症狀對於ASD分類上真的無關緊要嗎?
我想答案必然是否定的,就如同Lisa Jo Rudy文中所引用 UC Davis – M.I.N.D. Institute 網頁所說:
"Children with autism clearly are not all the same," said David G. Amaral, research director of the UC Davis M.I.N.D. Institute and co-director of the project. "The tremendous variation leads us to believe that autism is a group of disorders rather than a single disorder -- several autisms versus one autism. We are determined to provide the specific biomedical and behavioral criteria that accurately define distinct subtypes."   
-  From : M.I.N.D. Website – “Autism Phenome Project aims to redefine autism by identifying distinct subtypes”
拋開疾病分類中相關的社會性議題 (如:性別角色、白人、醫師角度或不當權力使用等),
單純以科學研究角度來看,ASD研究同樣也存有著許多的問題,
如近幾年針對Autism對於基因體上的研究報告,
像是2008年 Nature Reviews Genetics 中的” Advances in autism genetics- on the threshold of a new neurobiology “  、 2009 PLOS Genetics 的 “Genome-Wide Analyses of Exonic Copy Number Variants in a Family-Based Study Point to Novel Autism”   或其他ASD 於Genomic相關的論文。

可以發現針對實驗素材的蒐集幾乎都是未經性狀分類的,
對於當中linkage的分析,也僅以Multiplex families, simplex families 等方式進行分類,
卻未針對所有dataset的詳細type進行歸納,
如此,又如何能證實它的正確性呢?
這樣高成本耗資費時的研究,卻站在不完整的假說之上,是否能得到良好的貢獻、改善病患痛苦呢?

科學研究的條件與定義必須清楚合理,這是研究者的基本概念,
但在指鹿為馬的錯誤當下,如何改變既定的觀念,
我想,這是值得思考與檢討的地方!

不過可以慶幸的是,
面對這樣的挑戰, 我們比伽利略幸運多了!!

BP  2010.06.12

留言

這個網誌中的熱門文章

Google 資料庫方案–Spreadsheet–(1)資料呈現

HEMiDEMi 的標籤: Google , Google SpreadSheet , 雲端 早在規劃『 教育,意義! 』project時, 便有打算將整個網站建立過程撰寫一篇教學,讓有興趣以google 服務為基礎進行開發的朋友參考。 沒想到這個想法擺著就拖了好幾個月, 好在學生提出了問題,就趁這機會寫一寫吧。 基本上『 教育,意義! 』網站的架構完全建立在Google提供的服務, 廣義來說也是個雲端的系統, 所有的資料是分散在不同的服務架構下,再用GAE, Javascrript將服務資訊串接起來, 由Blogspot 統一呈現。 省了租主機的費用,或架站的硬體、電費, 最好的地方在於不用管理主機維運的問題, 只要專心做我的創意、嘗鮮就好了!!   多棒! 若將『 教育,意義! 』網站依功能層次來分類,可以分為三層結構, 當中的層次與使用技術大致如下: UI 介面層 服務 : Blogspot (網站介面) , Picasa (相簿空間), Google Apps 技術 : Javascript , AJAX ( JQuery ) App應用層  服務 : Google App Engine (GAE) 技術 : Java, Java Server Page (JSP) 資料層 服務 : Google Docs (文件), Google Spreadsheet (試算表) 技術/函式庫 : Java, Google Data APIs 本篇文章將著重在介紹以Google Spreadsheet 做為雲端資料庫, 其他主題將會陸續推出。 若對Google API 與 Google App Engine 初步建置有興趣, 可以參考之前文章: 佛心來著的 Google Data API – for JAVA 雲端的開始:Netbeans 無痛 Google App Engine Java 服務開發 Google Spreadsheet 做為資料庫系統 對於小型的資料系統來說, 採用Google Spreadsheet做為應用程式資料庫(如問卷調查或線上系統) 也算堪用, 目前的儲存限制為 : 40 萬個儲存格 每張工作表最多...

醫學健康跨領域合作的開始:資料工程

一直都很喜歡在會議上與跨領域的專家、醫師、學者分享我們在數據工程與分析應用上的發展經驗。 許多的專家學者,對於大數據應用的認知都仍侷限在一個超大型結構化資料集的子集合應用,在規劃好的條件設定下,針對特定的目標(疾病、行為)進行篩選,將數據narrow down到可以被個人電腦或是單一伺服器架構處理的小型資料集。 這樣的半手工處理方式,對於專一(Specific)領域主題的資料追蹤計算或許已經十分足夠,但當中倘若資料清理方式有改變、篩選條件增減,所有的數據都要從raw重新處理,不僅造成大量的時間與人力浪費,對於專案計畫進度的延宕更是麻煩。這些還不包含

當咒術成真 - 文字生成的虛擬世界

  2024/02  這幾天灌爆各大ai社群的,不外乎就是文字生成高清畫質影像的OpenAI Sora , 讓人驚艷的細膩表現,自動化的場景生成與運鏡效果,縱使這個概念並不是多創新的模式,但Open AI始終很懂得抓住大家眼球  (Sora的各種生成影片: https://openai.com/sora  ) 關於Sora 的技術與介紹,不妨看看chatGPT 對它的描述: OpenAI Sora文字-視訊生成模型 在視頻數據上進行大規模訓練生成模型,具體而言,OpenAI聯合訓練了文本條件擴散模型,處理不同持續時間、解析度和長寬比的視頻和圖像。利用了一種在視頻和圖像潛碼的時空塊上操作的轉換器架構。受到Srivastava等人(2015年)在使用LSTMs進行視頻表示學習的無監督學習的啟發,OpenAI的最大模型Sora擴展了這些概念,能夠生成一分鐘的高保真度視頻。此外,Chiappa等人(2017年)描述的循環環境模擬器方法與我們的方法論框架相一致,表明擴大視頻生成模型的規模是建立通用物理世界模擬器的一條有希望的道路。 一、技術創新 OpenAI 的 Sora 模型在技術創新上主要融合了 diffusion models 與 transformer models 的特點,這一結合代表著從文字描述到視覺內容生成的一大進步。根據 Goodfellow et al. (2014) 的研究,Generative Adversarial Nets (GANs) 開創了使用機器學習生成圖像的新方法,而 diffusion models 則透過逆向的擴散過程從隨機噪聲中逐步建構出有意義的圖像,提供了一種不同於傳統 GANs 的新途徑。另一方面,Vaswani et al. (2017) 提出的 transformer 模型,通過其自注意力機制有效處理長距離依賴關係,已廣泛應用於語言模型中。Sora 模型的創新之處在於將這兩種技術融合應用,實現了從簡單文本提示生成高質量視覺內容的能力,這不僅展示了機器學習技術的新高度,也為未來的影像生成、自然語言處理和人機交互開啟了新的可能性。 二、物理現象與現實世界的模擬 Sora 的另一大進步是在模擬現實世界物理現象方面的表現。雖然現有模型如 Raissi et al. (2019) 所提出的 Physi...