跳到主要內容

你確定,站的是巨人肩膀?

你確定,站的是巨人肩膀?

f1000023 

第5屆生物資訊線上論壇開放上線!
(The 5th Virtual Training Workshop on Bioinformatics)
網址:http://www.abren.net/workshop/
使用者可以透過免費註冊後登入觀看各個Lecture,
瞭解近期生物資訊領域的相關研究成果。

身為領域研究人員,個人非常欣賞這個workshop,
有著相同TED般的分享精神(不過是學術版),
透過這樣邀請演講方式讓學術研究、領域知識得以傳播,
打破學術界常長久以來由出版商壟斷的"局限知識"。

這也是一般人難以瞭解的,
為何拿取國家經費進行研究的學者,其研究成果還必須"繳錢"發表至期刊,
而其論文版權還歸屬於出版商所有? 

這種荒唐的現象為了什麼?
為的是出版商給的一個Impact Factor量化指標,說文章在那價值比較高,
所以要繳錢給他,版權歸他並且文章由他發表還不能說他剽竊!

然而,當拿著同樣國家經費,進行相似研究的學者們,
想要分享其研究成果以精進自身研究時,卻還需要再向出版商"買"回來!
奇妙的事就這麼發生了,
拿著國家的錢進行研究,研究結果再拿著國家的錢付費發表,其他人再拿著國家的錢去買回來!

最終出錢的國家得到什麼?  : 『  一個  0.n~N 的數字  』
通常是個位數,還不可能到100 !  (資訊領域很多還是0以下的小數!)
而印象中目前最高的似乎是 A Cancer Journal for Clinicians ( IF: 94.333 , 2011, 若有錯誤請指正)
它頗有良心的開放免費下載 (因為已經跟投稿人收了)。

但被當凱子的國家學術機關卻從未懷疑這套遊戲規則,


還大力推崇這單薄的數字做為評鑑學者的依據,
所以,學者再也不學者,反化身 paper machine ,
重要卻費時的基礎研究乏人問津,
卻一窩蜂做著應用研究,超短線、收成快,出paper也快!
junk paper 就此產生,浪費了資源,肥了出版商,
更甚那些藉著自我引用拉高IF的惡劣出版商!名副其實的自肥!

12世紀法國哲學家 Bernard of Chartres 說 :
“Nos esse quasi nanos gigantium humeris insidientes”   即之後之牛頓所講的
Standing on Shoulders of Giant  - 站在巨人的肩膀上”

可笑的是,在這變質的世代,這個巨人卻顯得很市儈!
實在令人歔欷!!

好在目前有越來越多人開始理解這樣的問題,
漸漸的也開始出現免費的線上電子期刊,
更甚出現像Virtual Training Workshop on Bioinformatics 的開放式免費論壇,
為這池既豐富卻狹隘陳腐的學術小圈圈注入了清流,
期望這樣的開始,能逐漸改變學術的思維,更甚不當的體制,

少了過勞死、多了高品質的學術成果!
何樂而不為?

PAN
2012.01.09

留言

這個網誌中的熱門文章

醫學健康跨領域合作的開始:資料工程

一直都很喜歡在會議上與跨領域的專家、醫師、學者分享我們在數據工程與分析應用上的發展經驗。 許多的專家學者,對於大數據應用的認知都仍侷限在一個超大型結構化資料集的子集合應用,在規劃好的條件設定下,針對特定的目標(疾病、行為)進行篩選,將數據narrow down到可以被個人電腦或是單一伺服器架構處理的小型資料集。 這樣的半手工處理方式,對於專一(Specific)領域主題的資料追蹤計算或許已經十分足夠,但當中倘若資料清理方式有改變、篩選條件增減,所有的數據都要從raw重新處理,不僅造成大量的時間與人力浪費,對於專案計畫進度的延宕更是麻煩。這些還不包含

Google 資料庫方案–Spreadsheet–(1)資料呈現

HEMiDEMi 的標籤: Google , Google SpreadSheet , 雲端 早在規劃『 教育,意義! 』project時, 便有打算將整個網站建立過程撰寫一篇教學,讓有興趣以google 服務為基礎進行開發的朋友參考。 沒想到這個想法擺著就拖了好幾個月, 好在學生提出了問題,就趁這機會寫一寫吧。 基本上『 教育,意義! 』網站的架構完全建立在Google提供的服務, 廣義來說也是個雲端的系統, 所有的資料是分散在不同的服務架構下,再用GAE, Javascrript將服務資訊串接起來, 由Blogspot 統一呈現。 省了租主機的費用,或架站的硬體、電費, 最好的地方在於不用管理主機維運的問題, 只要專心做我的創意、嘗鮮就好了!!   多棒! 若將『 教育,意義! 』網站依功能層次來分類,可以分為三層結構, 當中的層次與使用技術大致如下: UI 介面層 服務 : Blogspot (網站介面) , Picasa (相簿空間), Google Apps 技術 : Javascript , AJAX ( JQuery ) App應用層  服務 : Google App Engine (GAE) 技術 : Java, Java Server Page (JSP) 資料層 服務 : Google Docs (文件), Google Spreadsheet (試算表) 技術/函式庫 : Java, Google Data APIs 本篇文章將著重在介紹以Google Spreadsheet 做為雲端資料庫, 其他主題將會陸續推出。 若對Google API 與 Google App Engine 初步建置有興趣, 可以參考之前文章: 佛心來著的 Google Data API – for JAVA 雲端的開始:Netbeans 無痛 Google App Engine Java 服務開發 Google Spreadsheet 做為資料庫系統 對於小型的資料系統來說, 採用Google Spreadsheet做為應用程式資料庫(如問卷調查或線上系統) 也算堪用, 目前的儲存限制為 : 40 萬個儲存格 每張工作表最多...

當咒術成真 - 文字生成的虛擬世界

  2024/02  這幾天灌爆各大ai社群的,不外乎就是文字生成高清畫質影像的OpenAI Sora , 讓人驚艷的細膩表現,自動化的場景生成與運鏡效果,縱使這個概念並不是多創新的模式,但Open AI始終很懂得抓住大家眼球  (Sora的各種生成影片: https://openai.com/sora  ) 關於Sora 的技術與介紹,不妨看看chatGPT 對它的描述: OpenAI Sora文字-視訊生成模型 在視頻數據上進行大規模訓練生成模型,具體而言,OpenAI聯合訓練了文本條件擴散模型,處理不同持續時間、解析度和長寬比的視頻和圖像。利用了一種在視頻和圖像潛碼的時空塊上操作的轉換器架構。受到Srivastava等人(2015年)在使用LSTMs進行視頻表示學習的無監督學習的啟發,OpenAI的最大模型Sora擴展了這些概念,能夠生成一分鐘的高保真度視頻。此外,Chiappa等人(2017年)描述的循環環境模擬器方法與我們的方法論框架相一致,表明擴大視頻生成模型的規模是建立通用物理世界模擬器的一條有希望的道路。 一、技術創新 OpenAI 的 Sora 模型在技術創新上主要融合了 diffusion models 與 transformer models 的特點,這一結合代表著從文字描述到視覺內容生成的一大進步。根據 Goodfellow et al. (2014) 的研究,Generative Adversarial Nets (GANs) 開創了使用機器學習生成圖像的新方法,而 diffusion models 則透過逆向的擴散過程從隨機噪聲中逐步建構出有意義的圖像,提供了一種不同於傳統 GANs 的新途徑。另一方面,Vaswani et al. (2017) 提出的 transformer 模型,通過其自注意力機制有效處理長距離依賴關係,已廣泛應用於語言模型中。Sora 模型的創新之處在於將這兩種技術融合應用,實現了從簡單文本提示生成高質量視覺內容的能力,這不僅展示了機器學習技術的新高度,也為未來的影像生成、自然語言處理和人機交互開啟了新的可能性。 二、物理現象與現實世界的模擬 Sora 的另一大進步是在模擬現實世界物理現象方面的表現。雖然現有模型如 Raissi et al. (2019) 所提出的 Physi...