特徴量削減手法について、大体何かしらを漏らしてしまうことが多いので、一覧をメモ。

基本的に

  1. Filter法で大まかに削る
  2. Wrapper法もしくはEmbedded法によって削減する
    • 線形のモデルを用いるべきか非線形を用いるべきか

と言った流れで行うことが多い。


以前、モンテカルロ法により円周率を推算する方法を調べて、実装した。

https://note.yu9824.com/study/2022/07/30/monte-carlo-simulation-pi.html

このとき、よく知られた無理数の定数のうちの一つであるネイピア数$e$はどうなんだろうと思った。

調べてみると結構面白かったので、簡単な証明を自分でしつつ、メモする。


マテリアルズインフォマティクスに関わっていると、MDなど、計算科学的シミュレーションに関する話を聞くことも多い。

このとき、しばしばモンテカルロ法という言葉を聞いた。しかし、自分は実験系の出身で計算科学の知識に乏しく、手法のイメージがつかなかった。

これについて調べてみたところとても面白く、概念としてはわかりやすものだったので、ここに記しておく。


ある材料の物性を予測して最適化したい場合、物性を一つだけ予測して済むケースは少ない。

たとえば簡単な例では、ある性能を高めたいけれど、値段が高くてはお客様に買ってもらえないので、価格を抑えたいケースを考える。このとき、価格とその材料の性能の二種類の最適化したい対象が存在し、両方ができる限り最適になるようにしていく、いわば、パレート解の探索を行う。

ここでは、ハイパーパラメータの探索などに用いられるブラックボックス最適化ライブラリoptunaで多目的最適化を行い、パレート解を列挙する方法や、それを図示する方法について記す。


最近の投稿

フィンガープリントによる部分構造の可視化について
マテリアルズインフォマティクス (MI) において最も重要な要素のうちの一つとして、モデルの解釈が挙げられる。モデルを解釈することで、ドメイン知識と照らし合わせてモデルの正しさを確認することや新たな知見を得ることができる。化学構造とその化合物の性質を紐づけて解析を行う定量的構造物性相関 (Quantitative...
特別なソフトなしに化合物3Dモデルを動かしてもらう
特別なソフトを使わずに化合物の3次元構造を描画できるようにしたかった。実際、世の中に化合物を描画するソフトはたくさんあるが、基本的に自分だけでなく見る相手にもそのソフトを使用してもらう必要がある場合がほとんどである。一般に、会社のPCにソフトをインストールするためには複雑な申請が必要であるケースがある(特に大きな...
shap.summary_plotでカラーバーが表示できない
shapで解析した結果を可視化しようとした際、よくわからないmatplotlibのエラーに遭遇した。調べても出てこず、色々試した結果うまくいったのでエラーコードと共に対処法を示す。バグなのか仕様変更なのかはわかっていない。
M1 MacのDocker上でのR studio環境構築
訳があってRをやらなくてはならなくなった。環境構築をするにあたってローカルにインストールすることも考えたが、再現性やソフトの競合を避けるという意味でdockerコンテナ上に環境を構築することにした。単にrstudioのイメージを使用して環境構築することができなかったが、いくつか工夫をすることで対処することが可能だ...
Windowsではコードブロックのフォントを指定しないと見づらくなるという教訓
自分の環境では気づかなかったが、Windowsにおいてコードブロックのフォントが見づらいものになってしまった。これを解決するためにコードブロック用のWebフォント(Ricty Diminished)を設置し、指定することにした。