Fred Kuo :: Blog

Print by Number :: data approaching via machine learning

十一月 1st, 2022 › Uncategorized › Administrator ›

data approaching via machine learning

i1以外的色彩量測儀器陸續在市場上出現，數據一致性這個問題避免不了！

這個問題衍生出幾個工作面向需要去處理。

一、什麼樣的差異是堪用的？1個de00？兩個de00？

我的看法：對要拿認證的廠，會要求到1個de00。資料上，Techkon SpectroDens 與 Xrite eXact 也是有1個de00的差距。

還有更多更多的廠、還沒有建立起數據觀念的廠，一些較低門檻的、兩個de00的敲門磚，我還是認可的。這些低門檻的設備，還是可以幫著帶到相當的位置。

以上圖中 Epson sd-10 、 CR30 跟 i1 的差距大約都是兩個de00；倒是 sd10 與 cr30 的差距還小一些，我的數據落在1.38 de00。

二、經由這些儀器將色彩解譯為數字，一旦是數字，我們就可以透過一些數學(統計學)程序來優化這些數字，讓儀器之間呈現的數值可以更接近。不管低階高階，對我來説，是有必要去找一個工作程序，讓兩個儀器的數字接近。

上次做過一次以紙白的光譜差別作為修正基礎，有取得一些改善成果，但多測試些樣本的時候，發現有的顏色的色差反而變大，這樣的結果還是不夠安全。就像某個藥品廣告說的：先求不傷身體，再來講求療效。同樣的，我必須先找一個比較保守的方法，至少色差不能變大，再來講究數據差的縮小。

這次經由以前的工作夥伴蔡同學處取得python Machine Learning 的樣版程式，想著這個對我 data approaching 這個題目應該有幚助。

再去多瞭解一些，看來就是很多統計學的函式庫，主要是在調用上顯得方便零活許多。內容很多，需要一些時間去消化理解。這次先試試 Multiple Regression 看看能有什麼成果。

首先，要怎麼餵資料就是一門學問：要多少樣本數？色彩樣本的分佈情況？樣本的參考點要設多少個？怎麼設？

一方面要增加精度、一方面又要讓操作儘量精簡；各種方面的考慮需要不斷的Trail and error去找到最佳的組合。

Fig. 這次用了16個樣本來學習。

Fig. 參考點取4個地方，分別是 460nm, 520nm, 630nm 及光譜反應總和(weight)。

依程序回測了三個樣本，大概就從2個de00拉到1個de00左右，算是有効的運作。

Fig. 樣本一，de00由 2.42降到1.42。

Fig. 樣本二，de00由 1.85降到1.18。

Fig. 樣本三，de00由 2.16降到1.27。

這次只是Machine learning 在 Data Approaching 的一個開端，各種machine learning 的運用還需要去更深入瞭解，樣本的取用邏輯及資料的餵法都還在嘗試及學習。

儀器間的數據迫近在我這邊會是一個長期的題目，隨著樣本收集方式的改進與對machine learning 能力的理解與運用，期待的是精度再提昇、操作方式更精簡。

計畫目標是隨時都能迫近到一個de00，會是以雲端平臺的方式提供服務；利用平臺的大量收據來繼續精進machine learning 的結果。這當中大量儀器的數據與機器學習之間的串接，還需要大量IT能力的支援。

先畫個餅，能實現到什麼程度我也不知道，總之，是該開始動起來了。

Be the first to like.

Unlike

Share on Facebook

Tweet This Post

Visitors have not browsed from this post. Become the first by clicking one of our related posts

Print by Number :: data approaching via machine learning

Find

Fred on Print

Contact

Note

近期迴響

Random Posts

Month Collect

meta

Facebook

Downloads

Fred Kuo :: Blog

Print by Number :: data approaching via machine learning

Find

Fred on Print

Contact

Note

Tag Cloud

近期迴響

Random Posts

Month Collect

meta

Facebook

Downloads