生殖特性の高い分散の意味

1 min read

植物材料

合計507そば(Fagopyrum esculentum)生殖質アプローチは、韓国のRDA(Rural Development Administration)遺伝子銀行によって提供されました。

カメラシステム設定

23.5×15.7 mmの解像度とレンズ(af-s dx Nikkon 16-80 mm f / 2.8-4 e ed vr、Nikon Imaging Japan Inc.、東京、日本)を用いて画像を取得した。 800×800×800mmサイズのスタジオボックス(M80スタジオ、中国)を設置した。 670×470×20mm面積のLED(Light-Emitting Diode)基板(ArtLight, Unclepen co., Bucheon, Korea)は、データ作成時の影による画像誤差を低減するために設定した。 そばの影は逆光を用いて除去した。 また、5500K±200温度の600×10mmサイズの背板2個と5600K温度のLED照明スタンド(N-T96 LED、Prodean co.、Seoul、Korea)2個を設置してそばの影を除去した。 スタジオボックスで画像を撮るプロセス。 255×310mmサイズの青色ポリプロピレン(PP)(color clear PP “L” Holder, 玄風㈱ポッチェンコリア) 面積にそば種子を手作業で塗布した。 青いPPはクロマキ効果があり、背景からそばを簡単に分離できます。 このシステムで撮影された各画像には、平均的に生殖系列アプローチあたり95種が含まれています。

カメラ(Nikon, Japan)で地上25cmの高さで撮影したそば種子の垂直赤緑青(RGB)画像を獲得しました。 実際のサイズと比較してデータを計算するために、スケールバーに16mmタグを使用しました。 光の条件による色値の誤差を最小限に抑えるために標準色を選択し、青PPにカラータグを追加しました。 たとえば、カメラの設定とシード画像の写真は、補足画像にあります。 1と2.

画像解析処理

ソバの種子イメージは、ImageJ(ImageJ、National Institutes of Health、USA、rsd.info.nih-gov/ij)プログラムに基づいて韓国農村振興庁によって開発されたソフトウェアで処理されました。 このプログラムにより、画像データを編集、補正、測定、分析、処理できます。7。 実験では、ImageJで使用されているマクロなどのツールに拡張できます。 画像の編集中にスケール設定でサイズをミリメートルに変換しました。 標準タグを選択し、ピクセルのサイズを16mmに設定した。

RGBチャネルに分離するために、背景からシードを分離するために使用されるImageJを使用しました。 RGBチャンネルの分離により、シードの色が単純化されているため、背景からシードをより簡単に分離できます。 RGBチャネル分離後、シードと背景分離を完了するために、ピクセル値のしきい値を使用してバイナリ画像を作成しました。 ノイズ粒子は、画像中のソバ以外のノイズ粒子測定を避けるために、種子サイズよりも100倍小さいピクセル値で処理した。 ソバの種の領域は、オブジェを連結せずに独立した領域に各部分に分離した。8。 図1は、画像ベースの表現型のエンドツーエンドのパイプラインを簡単に示しています。

データ分析

種子面積、幅、高さ、円形度、および真円度の5つの種子形状特性が画像化されています(表1)。 個々のソバ種子の画像から特性を抽出した(表1)。 全てのデータ分析はPython 3.8.5を用いて行った。9。 データは、507のITラインを持つ48,047のサンプルで構成されています。 ライン当たりの平均、最大および最小サンプル数は、それぞれ94.7、238および41である。 値が0のサンプル4個と高さ99.163のサンプル1個を削除しましたが、これは平均高さが5.67なので大きすぎます。 ラインごとの各機能のデータ分布は、Shapiro-Wilk正規性テストを使用してテストされました。10。 507行が失敗した理由は、行のフィーチャーの1つ以上がp値が0.05未満であるためです。 データ分布をさらに確認するために、Seabornパッケージのカーネル密度推定(KDE)プロットで選択したそば線の各機能を視覚化しました(図1を参照)。 X軸は単一機能のデータ範囲を表します。 Y軸は、スムージングヒストグラムで見られる密度の確率を表します。 正規性検定が失敗しても、データが正規分布にほぼ準拠し、異常値が存在しないことがわかります。

クラスタリングのために、ライン当たりの各機能の中央値を計算した。 さまざまなデータセットで強力なクラスタリング結果を示すため、k平均クラスタリングを選択しました。11。 所与のkについて、k平均クラスタリングはサンプルをk個のクラスタに分割し、各サンプルは最も近い距離のクラスタに属します。 k-平均クラスタリングは、各サンプルとその中心との間の距離の二乗の合計である歪みを最小限に抑えようとします。 補足図3は、クラスタ数に基づいて計算された歪み値を示しています。

歪み値は、kが6より小さくなるまで急激に減少する。 kが大きいほど、歪み値は急激に減少しません。 kの最適な選択は6になります。 補足図3は、X軸とY軸に配置された2つのフィーチャペアに対してkが6の場合のK平均クラスタリングの結果を可視化します。 対角線のプロットは、各クラスタに対する対応する機能の密度分布を示す。

カーネル密度推定(KDE)プロットは、さまざまなデータ型を視覚化し、間隔内のデータのピークを簡単に視覚化するために広く使用されています。12。 選択した4つのアクセスで、各機能の密度プロットをPlotlyで視覚化しました(図3)。 x軸は単一機能のデータ範囲を表します。 y軸はx軸に対応する密度の確率を表し、1よりも重要です。13また、すべての購読ごとの各機能の密度プロットは、補足図4にあります。

Spearmanの方法を用いて機能間の相関を計算した。14 (図2参照)。 この方法は、データが正規分布に完全に従わないという事実のために選択された。 相関係数とp値(図3)に基づいて、特性間に相関がないことを確認できます。

Omori Yoshiaki

ミュージックホリック。フードエバンジェリスト。学生。認定エクスプローラー。受賞歴のあるウェブエキスパート。」

You May Also Like

More From Author

+ There are no comments

Add yours