跳到主要內容

程式設計就是摳摳摳


看著畢業的日子漸漸接近,
終於自己的研究程式總算將近尾聲,雖然連續幾天的密集coding讓人通體舒暢,
但一想到未來還有好多好多題目等著我摳摳摳.....頭皮不禁一陣發麻。


回顧碩班被當成coding machine的心路歷程,


一路走來,不知不覺竟也聚沙成塔了,


從最初好玩寫的Schedule、Memo程式、三缺一大賽註冊系統、細線化Thining數值分析程式、
雯玲學姐的promoter分析統計程式、core promoter分析程式。


到自己研究上所用的,
啟發式貪婪多重PCR引子設計演算法、蛋白質截短衍生物定位演算法、寡核甘酸計算模組、
階層式引子分群演算法、最大Clique問題演算法、Clique分群演算法、多重PCR引子挑選之基因演算法、
和幾個動態規劃實作的序列分析程式。


還有芋伯源、一姐研究用到的,自動建構Ontology演算法、半自動新增Ontology節點演算法、
Adaptive Resonance Theory (ART) 分群法、階層遞迴式ART Tree演算法、TF-IDF計算模組、
潛在語意分析(LSA)計算模組、文件分析及關鍵字粹取模組、自動化中研院遠端斷詞系統、
相似度比較模組。


甩甩豪的模糊矩陣模組、物流配送點分配、客戶點分群程式和學長的分類評估模組。


和課業上寫的數值分析程式、Fuzzy polynucleotide space序列分析、統計程式.....


 


學了好多、寫了好多、也摳了好多.....


 


雖然我使用的方法與過程往往都是最直覺最笨的方法,
但總是能跑出些東西,看到點什麼....


Simple is good!!! (起碼我還有-XmsNm -XmxNm不讓它爆掉 ^^ )


所以給擔心或害怕寫程式的朋友,



別驚 也別慌,


我沒學過系統分析、演算法老師在教C、資料結構我在毀睿玩打屁玩排七,


 


但慢慢來、一步一步做,燃燒生命的寫,
還是會有點成果,甚至能幫同學一些忙。


那你們還有什麼好擔心的呢?
驚驚不得一等,大家往往都是因為不熟去排斥,因為初體驗而駐足不前,


 


事實上程式就是要摳呀,用力的摳努力的摳不屈不饒的摳.....
摳摳摳摳摳.......管他什麼演算法、資料結構,
摳出來能跑就是好程式。


(講歸講啦,演算法資結還是要瞭解啦....哈哈哈!!!)



不過就如老闆所言,或許現在感覺無所謂,
但程式設計與系統分析、專案規劃都可能是未來就業的敲門磚,


那何不趁就學時的當下,輕輕鬆鬆學程式設計、快快樂樂做研究呢...^^


(一度曾以為我是不是在某家軟體公司上班,但一個月1500的薪水讓我驚覺我的確在唸碩班 =.= )


 


程式設計並不難,起碼我覺得比微積分、工數、機率統計、數值分析那堆火星科目簡單的多。


而且或許這是另一種富有潛在價值的技能唷,
想想出社會後,去超市買個東西需要微積分找零錢嗎?
所以除非你要學傑叔用機率統計去算明牌....


不然學個有用的敲門磚又何嘗不好呢?


你共洗嗯洗呀??


 



                                       BP


P.S:上述的程式,除了未發表的研究主體礙於老闆會砍人的原則上不能提供外,


  如果有哪些用的到的模組想要參考修改,歡迎mail給我索取,不過寫的不好請見諒呢。


 


 

留言

這個網誌中的熱門文章

醫學健康跨領域合作的開始:資料工程

一直都很喜歡在會議上與跨領域的專家、醫師、學者分享我們在數據工程與分析應用上的發展經驗。 許多的專家學者,對於大數據應用的認知都仍侷限在一個超大型結構化資料集的子集合應用,在規劃好的條件設定下,針對特定的目標(疾病、行為)進行篩選,將數據narrow down到可以被個人電腦或是單一伺服器架構處理的小型資料集。 這樣的半手工處理方式,對於專一(Specific)領域主題的資料追蹤計算或許已經十分足夠,但當中倘若資料清理方式有改變、篩選條件增減,所有的數據都要從raw重新處理,不僅造成大量的時間與人力浪費,對於專案計畫進度的延宕更是麻煩。這些還不包含

Google 資料庫方案–Spreadsheet–(1)資料呈現

HEMiDEMi 的標籤: Google , Google SpreadSheet , 雲端 早在規劃『 教育,意義! 』project時, 便有打算將整個網站建立過程撰寫一篇教學,讓有興趣以google 服務為基礎進行開發的朋友參考。 沒想到這個想法擺著就拖了好幾個月, 好在學生提出了問題,就趁這機會寫一寫吧。 基本上『 教育,意義! 』網站的架構完全建立在Google提供的服務, 廣義來說也是個雲端的系統, 所有的資料是分散在不同的服務架構下,再用GAE, Javascrript將服務資訊串接起來, 由Blogspot 統一呈現。 省了租主機的費用,或架站的硬體、電費, 最好的地方在於不用管理主機維運的問題, 只要專心做我的創意、嘗鮮就好了!!   多棒! 若將『 教育,意義! 』網站依功能層次來分類,可以分為三層結構, 當中的層次與使用技術大致如下: UI 介面層 服務 : Blogspot (網站介面) , Picasa (相簿空間), Google Apps 技術 : Javascript , AJAX ( JQuery ) App應用層  服務 : Google App Engine (GAE) 技術 : Java, Java Server Page (JSP) 資料層 服務 : Google Docs (文件), Google Spreadsheet (試算表) 技術/函式庫 : Java, Google Data APIs 本篇文章將著重在介紹以Google Spreadsheet 做為雲端資料庫, 其他主題將會陸續推出。 若對Google API 與 Google App Engine 初步建置有興趣, 可以參考之前文章: 佛心來著的 Google Data API – for JAVA 雲端的開始:Netbeans 無痛 Google App Engine Java 服務開發 Google Spreadsheet 做為資料庫系統 對於小型的資料系統來說, 採用Google Spreadsheet做為應用程式資料庫(如問卷調查或線上系統) 也算堪用, 目前的儲存限制為 : 40 萬個儲存格 每張工作表最多...

當咒術成真 - 文字生成的虛擬世界

  2024/02  這幾天灌爆各大ai社群的,不外乎就是文字生成高清畫質影像的OpenAI Sora , 讓人驚艷的細膩表現,自動化的場景生成與運鏡效果,縱使這個概念並不是多創新的模式,但Open AI始終很懂得抓住大家眼球  (Sora的各種生成影片: https://openai.com/sora  ) 關於Sora 的技術與介紹,不妨看看chatGPT 對它的描述: OpenAI Sora文字-視訊生成模型 在視頻數據上進行大規模訓練生成模型,具體而言,OpenAI聯合訓練了文本條件擴散模型,處理不同持續時間、解析度和長寬比的視頻和圖像。利用了一種在視頻和圖像潛碼的時空塊上操作的轉換器架構。受到Srivastava等人(2015年)在使用LSTMs進行視頻表示學習的無監督學習的啟發,OpenAI的最大模型Sora擴展了這些概念,能夠生成一分鐘的高保真度視頻。此外,Chiappa等人(2017年)描述的循環環境模擬器方法與我們的方法論框架相一致,表明擴大視頻生成模型的規模是建立通用物理世界模擬器的一條有希望的道路。 一、技術創新 OpenAI 的 Sora 模型在技術創新上主要融合了 diffusion models 與 transformer models 的特點,這一結合代表著從文字描述到視覺內容生成的一大進步。根據 Goodfellow et al. (2014) 的研究,Generative Adversarial Nets (GANs) 開創了使用機器學習生成圖像的新方法,而 diffusion models 則透過逆向的擴散過程從隨機噪聲中逐步建構出有意義的圖像,提供了一種不同於傳統 GANs 的新途徑。另一方面,Vaswani et al. (2017) 提出的 transformer 模型,通過其自注意力機制有效處理長距離依賴關係,已廣泛應用於語言模型中。Sora 模型的創新之處在於將這兩種技術融合應用,實現了從簡單文本提示生成高質量視覺內容的能力,這不僅展示了機器學習技術的新高度,也為未來的影像生成、自然語言處理和人機交互開啟了新的可能性。 二、物理現象與現實世界的模擬 Sora 的另一大進步是在模擬現實世界物理現象方面的表現。雖然現有模型如 Raissi et al. (2019) 所提出的 Physi...