Print by Number :: data approaching via machine learning

data approaching via machine learning

i1以外的色彩量測儀器陸續在市場上出現,數據一致性這個問題避免不了!

這個問題衍生出幾個工作面向需要去處理。

一、什麼樣的差異是堪用的?1個de00?兩個de00?

我的看法:對要拿認證的廠,會要求到1個de00。資料上,Techkon SpectroDens 與 Xrite eXact 也是有1個de00的差距。

還有更多更多的廠、還沒有建立起數據觀念的廠,一些較低門檻的、兩個de00的敲門磚,我還是認可的。這些低門檻的設備,還是可以幫著帶到相當的位置。

以上圖中 Epson sd-10 、 CR30 跟 i1 的差距大約都是兩個de00;倒是 sd10 與  cr30 的差距還小一些,我的數據落在1.38 de00。

二、經由這些儀器將色彩解譯為數字,一旦是數字,我們就可以透過一些數學(統計學)程序來優化這些數字,讓儀器之間呈現的數值可以更接近。不管低階高階,對我來説,是有必要去找一個工作程序,讓兩個儀器的數字接近。

上次做過一次以紙白的光譜差別作為修正基礎,有取得一些改善成果,但多測試些樣本的時候,發現有的顏色的色差反而變大,這樣的結果還是不夠安全。就像某個藥品廣告說的:先求不傷身體,再來講求療效。同樣的,我必須先找一個比較保守的方法,至少色差不能變大,再來講究數據差的縮小。

這次經由以前的工作夥伴蔡同學處取得python Machine Learning 的樣版程式,想著這個對我 data approaching 這個題目應該有幚助。

再去多瞭解一些,看來就是很多統計學的函式庫,主要是在調用上顯得方便零活許多。內容很多,需要一些時間去消化理解。這次先試試 Multiple Regression 看看能有什麼成果。

首先,要怎麼餵資料就是一門學問:要多少樣本數?色彩樣本的分佈情況?樣本的參考點要設多少個?怎麼設?

一方面要增加精度、一方面又要讓操作儘量精簡;各種方面的考慮需要不斷的Trail and error去找到最佳的組合。

Fig. 這次用了16個樣本來學習。

Fig. 參考點取4個地方,分別是 460nm, 520nm,  630nm 及光譜反應總和(weight)。

依程序回測了三個樣本,大概就從2個de00拉到1個de00左右,算是有効的運作。

Fig. 樣本一,de00由 2.42降到1.42。

Fig. 樣本二,de00由 1.85降到1.18。

Fig. 樣本三,de00由 2.16降到1.27。

這次只是Machine learning 在 Data Approaching  的一個開端,各種machine learning 的運用還需要去更深入瞭解,樣本的取用邏輯及資料的餵法都還在嘗試及學習。

儀器間的數據迫近在我這邊會是一個長期的題目,隨著樣本收集方式的改進與對machine learning 能力的理解與運用,期待的是精度再提昇、操作方式更精簡。

計畫目標是隨時都能迫近到一個de00,會是以雲端平臺的方式提供服務;利用平臺的大量收據來繼續精進machine learning 的結果。這當中大量儀器的數據與機器學習之間的串接,還需要大量IT能力的支援。

先畫個餅,能實現到什麼程度我也不知道,總之,是該開始動起來了。

Be the first to like.
pixelstats trackingpixel

Tags: , ,

無迴響

rssComments RSS   transmitTrackBack Identifier URI

No comments. Be the first.

addLeave a comment