Print by Number :: data approaching via machine learning
data approaching via machine learning
i1以外的色彩量測儀器陸續在市場上出現,數據一致性這個問題避免不了!
這個問題衍生出幾個工作面向需要去處理。
一、什麼樣的差異是堪用的?1個de00?兩個de00?
我的看法:對要拿認證的廠,會要求到1個de00。資料上,Techkon SpectroDens 與 Xrite eXact 也是有1個de00的差距。
還有更多更多的廠、還沒有建立起數據觀念的廠,一些較低門檻的、兩個de00的敲門磚,我還是認可的。這些低門檻的設備,還是可以幫著帶到相當的位置。
以上圖中 Epson sd-10 、 CR30 跟 i1 的差距大約都是兩個de00;倒是 sd10 與 cr30 的差距還小一些,我的數據落在1.38 de00。
二、經由這些儀器將色彩解譯為數字,一旦是數字,我們就可以透過一些數學(統計學)程序來優化這些數字,讓儀器之間呈現的數值可以更接近。不管低階高階,對我來説,是有必要去找一個工作程序,讓兩個儀器的數字接近。
上次做過一次以紙白的光譜差別作為修正基礎,有取得一些改善成果,但多測試些樣本的時候,發現有的顏色的色差反而變大,這樣的結果還是不夠安全。就像某個藥品廣告說的:先求不傷身體,再來講求療效。同樣的,我必須先找一個比較保守的方法,至少色差不能變大,再來講究數據差的縮小。
這次經由以前的工作夥伴蔡同學處取得python Machine Learning 的樣版程式,想著這個對我 data approaching 這個題目應該有幚助。
再去多瞭解一些,看來就是很多統計學的函式庫,主要是在調用上顯得方便零活許多。內容很多,需要一些時間去消化理解。這次先試試 Multiple Regression 看看能有什麼成果。
首先,要怎麼餵資料就是一門學問:要多少樣本數?色彩樣本的分佈情況?樣本的參考點要設多少個?怎麼設?
一方面要增加精度、一方面又要讓操作儘量精簡;各種方面的考慮需要不斷的Trail and error去找到最佳的組合。
Fig. 這次用了16個樣本來學習。
Fig. 參考點取4個地方,分別是 460nm, 520nm, 630nm 及光譜反應總和(weight)。
依程序回測了三個樣本,大概就從2個de00拉到1個de00左右,算是有効的運作。
Fig. 樣本一,de00由 2.42降到1.42。
Fig. 樣本二,de00由 1.85降到1.18。
Fig. 樣本三,de00由 2.16降到1.27。
這次只是Machine learning 在 Data Approaching 的一個開端,各種machine learning 的運用還需要去更深入瞭解,樣本的取用邏輯及資料的餵法都還在嘗試及學習。
儀器間的數據迫近在我這邊會是一個長期的題目,隨著樣本收集方式的改進與對machine learning 能力的理解與運用,期待的是精度再提昇、操作方式更精簡。
計畫目標是隨時都能迫近到一個de00,會是以雲端平臺的方式提供服務;利用平臺的大量收據來繼續精進machine learning 的結果。這當中大量儀器的數據與機器學習之間的串接,還需要大量IT能力的支援。
先畫個餅,能實現到什麼程度我也不知道,總之,是該開始動起來了。
Tags: cr30, epson sd-10, machine learning
尚無留言
Comments RSS
TrackBack Identifier URI
No comments. Be the first.
Leave a comment