A way of thinking

筆者個人の思考過程です。意見には個人差があります。

AICによるモデルアベレージングと予測

意訳すると、「ひやっほーい。種の感受性分布(SSD)の分布にどの分布を選択したらいいかわからない!って問題があったけど、モデルアベレージングを使えば、これで解決やで。んでおれらはこれ使ってSSD書くぜ*1」みたいな論文に出会って、「うへぇ」ってなっていたのですが、そもそもモデルアベレージングについて、なんとなくAICによるweightによる計算方法はイメージがつくくらいで、よく知らないなぁと思ったので、いくつか文献を読んでみた。

Schwarz, C.J., Tillmanns, A.R., 2019. Improving statistical methods to derive species sensitivity distributions. Water Science Series, WSS2019-07, , Province of British Columbia, Victoria.

まずは、モデルアベレージングがよい!の根拠として、引用された文献がこれ。Rのパッケージでssdtools*2を作っているカナダのグループの報告書。確かに、モデルアベレージングがデータが追加されてもStableな予測値を出す、みたいな結果があるのだけど、限られたデータセットをベースにした解析だし、しかも判断は図で視覚的に…という感じで、主観的。あと、stableという点において、accurateかどうかは問題としていないことにも注意が必要。どちらかというと、insensitiveがもっとfairな表現じゃないかなぁと思ったりもする*3。また、この調べ方も、新しい毒性データを追加して、再度モデルを推定し直しているので、それじゃあパラメータもweightも全部変わるやん、と思うので、このあたりもなんとなく気持ちが悪い。前段として、異なる分布が同程度によくフィッティングする状況が分布の選択に困る場面として想定されているけど、個人的には、「いや、だからそれはもう多分どの分布で推定してもHC5一緒やで」とツッコみたくもなったり。
ということで、総じて、この文献をベースに、「モデルアベレージング最強やで」とグイグイくるのは...(以下略。

Dormann, C.F., Calabrese, J.M., Guillera-Arroita, G., Matechou, E., Bahn, V., Bartoń, K., Beale, C.M., Ciuti, S., Elith, J., Gerstner, K., Guelat, J., Keil, P., Lahoz-Monfort, J.J., Pollock, L.J., Reineking, B., Roberts, D.R., Schröder, B., Thuiller, W., Warton, D.I., Wintle, B.A., Wood, S.N., Wüest, R.O., Hartig, F., 2018. Model averaging in ecology: a review of Bayesian, information-theoretic, and tactical approaches for predictive inference. Ecol. Monogr. 88, 485-504.

ついでに、より一般的な文脈でのモデルアベレージングについてのレビューも参考に読んでみた。メモなどは以下の通り。数式は読み飛ばしているので、内容は是非ご自身でご確認下さい。

  • モデルアベレージングをする際に必要なってくるweightの推定自体に不確実性が発生する。このあたりは、恥ずかしながら、頭になかった。
  • 一方で、選択されたsingle-best modelを使った予測だと、どのモデルが正しいのかという点における不確実性が予測に含まれてないので、真の予測誤差を過小評価する。とのこと。
  • 一般論ではあるが、「信頼区間」のカバレッジは、モデルアベレージングによって、改善する”かもしれない”。という記述自体からも、モデルアベレージングがsilver bulletではないことが読み取れる。
  • 結論にも、「モデルアベレージングは、予測誤差を減少されるかもしれない、しかし、かならずしも減少するとも限らない」とも書いてる。
  • AICによるweightsを、確率のように扱っていいのか、という点についても、議論を呼ぶところですよと書いてある(すなわち、そもそもそのweightでいいのか、問題がある)。AIC weightsとブートストラップによるモデルweightsが本質的に違っていた(Burnham & Anderson 2002)という事例もあるとのこと。
  • 一方で、BICの方は、真のモデルの存在を仮定するので、そのモデルが真である確率、みたいなものをすんなり計算できそう、とも思った(これは感想)。
  • オススメ!自体は、最後のOverall conclusion and recommendationsを読むといいと思います!

*1:もちろん、あおり気味

*2:Rユーザーとしては、こういうの待ってましたというパッケージではあります

*3:さらに邪推すると、行政的には、stableな方が説明しやいという側面はあるのかもなぁと思ったり

Koelmansのマイクロプラスチックのリスク評価に関するレビュー

Koelmans, A.A., Redondo-Hasselerharm, P.E., Nor, N.H.M., de Ruijter, V.N., Mintenig, S.M., Kooi, M., 2022. Risk assessment of microplastic particles. Nature Reviews Materials 7, 138-152.

今更ながら通読。書いてあることにそんなに目新しいことはないのだけど、マイクロプラスチックのリスク評価の方法を考える上で重要な点を整理をして、新しい方法を提案している。以下は岩崎の整理。

  • マイクロプラスチック(MP)を単体としてみるのではなくて*1、自然に存在するシルトなどの粒子をベースにするというか、その中にMPを位置づけるというか、その点がよく強調されていて、他の自然粒子(natural particles)と並べて、特徴が整理されている(Table 1)*2
  • マイクロプラスチックの特徴(shapeやサイズとか)は、確率分布として連続で考えましょうというのが推しのよう。その意味で、以下のKooi et al. 2001は読めよ、と言われている感じ。この確率分布を活用したリスク評価みたいなのが、多分次の論文として来るのだろうか。。*3
    • Kooi, M., Primpke, S., Mintenig, S.M., Lorenz, C., Gerdts, G., Koelmans, A.A., 2021. Characterizing the multidimensionality of microplastics across environmental compartments. Water Res. 202, 117429.

重要な整理や面白い視点は提示されていると思うけど、やっぱりそういうレベルの高い評価って難しいよね、と思ったり(果たして、そこまで必要かと思ったりもします)。とりあえず、メモとして。しかし、ほんとに精力的にこの手の話をされていて、すごい。

*1:といってもマイクロプラスチック自体が多様ですが...

*2:余談だけど、マイクロプラスチックも、複合的な自然粒子の中の、人工的なphaseの一つとして捉えられるみたいな表現が本文にあって、いまいちピンとこなかった。

*3:もう我々が何かしようにも先手は取られている気がする

2022年の振り返りと2023年の目標

あけましておめでとうございます。更新頻度は月1くらいになっていますが、今年もどうぞよろしくお願いいたします。思いの他早く起きてしまったので、整理などを…。去年は2月頭から所内出向となったり、次男がちょっと大変な病気にかかってまだ寛解できていなかったりと、個人的に大変な1年でした。といっても、いずれもまだ継続中なので、過去形で書くのも変ですね。そんな中、変則的な勤務を許容してもらえることの有り難さを実感しています。

研究

  • 論文は、昨年紹介したものを除くと、主著2本(国際、国内1本ずつ)、コレスポ1本(国際)、共著2本という感じです。出向がなくても、周期的に少なめだった気がします。弊所的には主著の掲載誌はQ1でもないし、なんともいえない業績ではあるかもしれませんが、個人的には出したい論文を最低限出せて満足しています。
    • Yuichi Iwasaki, Pete Cadmus, James Ranville, William H. Clements (2022) Stream mesocosm experiments show no protective effects of calcium on copper toxicity to macroinvertebrates. Environmental Toxicology and Chemistry. 41(5): 1304–1310.
      • コロラド州立大学に滞在していたときの積み残しなので、10年くらい前のメソコスム試験の結果です。結果はシンプルで、米国の硬度補正の水質クライテリアベースに、銅の毒性を緩和すると思われるくらいカルシウム濃度(硬度)をあげても、全然底生動物への影響は緩和されなかったですよ、という結果です。これわりと当時衝撃だったのですが、BLMベースのクライテリアだとそういう緩和は予測していなくて、ちょっと残念に思ったりもした記憶があります。心残りとしては、結果としてもうちょっとカルシウム濃度が高かったほうがよかったよね・・・というところでしょうか。個人的に操作実験の楽しさを教えてもらったので、きちんと論文にできて良かったです。
    • 岩崎雄一, 小林勇太, 末森智美, 竹下和貴, 梁政寛(2022)日本全国の河川における水質測定地点 (環境基準点) の物理化学的特徴の整備とそれに基づくグルーピング. 水環境学会誌 45(5),231-237
      • 内容はタイトルのまんまで、ここで書いた内容です。12月のシンポでも紹介できて、その意味で個人的には満足なのですが、じゃあこっからというところがまだ個人的にすっきりしていないのが最近のもやもや。
    • Miina Yanagihara, Kyoshiro Hiki, Yuichi Iwasaki (2022) Can chemical toxicity in saltwater be predicted from toxicity in freshwater? A comprehensive evaluation using species sensitivity distributions. Environmental Toxicology and Chemistry. 41(8): 2021–2027.
      • 淡水と海水の種の感受性分布の比較で、ここで書いた内容です。これもある種わかりやすい結果ではあるのですが、きちんと論文にできて良かったです。もうひとつ継続で進めていて、それは今年論文投稿できることを!書きようによっては、いいところに載る気がするのですが。はてさて。
    • Masashi Kamo, Takehiko I. Hayashi, Yuichi Iwasaki (2022) Revisiting assessment factors for species sensitivity distributions as a function of sample size and variation in species sensitivity. Ecotoxicology and Environmental Safety. 246: 114170.
      • 対数正規分布を仮定した種の感受性分布について、種数と分散から、不確実性係数の決め方を提案した論文です。個人的に重要な成果だと思うのですが、これがきちんと使われるには、まだ少しステップや宣伝が必要なんだろうなぁとは思っています。一方で、Rのssdtoolsでお手軽にモデルアベレージングとかできるようになってきて、なんかちょっとなぁと個人的には思っているところです。
  • 論文奨励賞
    • まったく予想していなかったのですが、年齢ぎりぎりで、日本水環境学会から論文奨励賞(廣瀬賞)を頂きました。同じ所属で、しかも同じ企画室に出向中だった佐藤さんと一緒にもらえたのも個人的には思い出になりました。佐藤さんは、Water Researchで、ボクは水環境学会誌(しかも筆頭論文ではなくて、コレスポ)という違いが、実力の違いを感じますが、それでも、KGWさんとの成果がきっかけで受賞に繋がったのも地味ながらも日本語論文を書いてきてよかったなと思えた次第です。引き続きがんばります。
  • 今後の研究
    • 企画室で色々見ていると、改めて自分の研究やテーマについて考えさせられました。かといって、別になにか新しいことを急にやれといってもできるだけないのですが。。関連して、Hさんに「そろそろ自分ができることとかできないこととかみえてきますよね」ってメールで送ったら共感メール?が返ってきたので、そういうお年頃なのかもしれません。そんな余計なことを考えずにがむしゃらに○○とってきて、○○書け、と言われそうですが、なんとなくそんな時な気がするので、これは、今年のテーマとしてぼやっと頭に置いておきたいと思います。その意味でも、なにか新しい手法をできるようになることを今年の目標にしたいです。

日常

  • 2月からどたばたが発生し、公私共になかなかしんどい1年でした。まさか長男と合計2ヶ月くらい、二人で過ごすことになるとは、考えてもなかったのですが、まぁでもそれはそれで色々と学ぶことはあったように思います。月並みだけど、夜ご飯考えるの大変!とか。
  • 基本遠出はできてないのですが、長男が高知に一人で行ったのは、個人的に良かったんじゃないかなぁと思っています(自分のことではない)。
  • 夏休み終わりに流行りの感染症になって、ホテルに缶詰になったのも今思えばいい思い出だったかもしれません。ただ、10日間ホテルから出れないのは、なかなかしんどかった。。。食における味の多様性みたいなことの重要性を肌で実感したり。
  • ということで?、しばらく飲み会から完全に足を洗っています。まずは、次男が落ち着くのを第一に生きていきたいと思います。

今年の目標・抱負

  • 2月に出向があけたら、手は動かしつつ、今後をじっくり考えていきたいなぁと思います。
    • 出向での経験や昨今の情勢を考えると、ほんともう…という感じですね。まぁでも今は色々見えすぎているのかもしれません。
    • 目先のテーマでいうと、底生動物の解析、引き続きSSD研究、などなどでしょうか。
  • 論文は,もうすぐ投稿中の論文がなくなる気がするので*1科研費の成果をきちんと形にしたいところです。
  • 新しいことを学ぶ(新しい手法を一つ使えるようになる)
  • 英語の総説(ひとまず書いておくが,予定なし)
  • 今まで1回も行ったことがない日本の学会にも参加したい(こちらも予定なし)。
  • オンライン英会話を習ってもいいかも(療養中にお試しで少しだけやったのですが、わりと楽しかった)。

*1:希望的観測

年末年始の読書

ミーハーなので、#木曜日は本曜日 で、呂布さんがおすすめしていた爪切男さんの本を読んでみたが、とても面白くて、数日の細切れ時間で、読み切ってしまった。なんというかボクの世界ではないなぁと思いつつ*1、どこかに追体験しているような気分になるのもちょっとおもしろいかも。子どもに見せたくない本は全部実家に送っていると、呂布さんが言ってたのですが、まさしくこの本はそのたぐいです(いやでも面白かった)。強いていうと、ちょっと後半紐づけがわざとらしく感じた気もしますが。

*1:と思っているのは気のせいなのかもしれないけど

専門家とは誰か

近くの本屋で見つけて、悩みつつも購入してしまった本。複数の著者が各自の題を担当していて、いろんな人の考察を知る上ではよい機会になると思うし、確かに面白い話や目新しい話ももいくつかあったけど、語弊を恐れずに言うと、総じてまぁこんなもんかなぁという印象。タイトルから、ボクが想像する期待が大きすぎたということで。一応メモ。

全国の河川の環境基準点の物理化学的特徴の整備

岩崎雄一, 小林勇太, 末森智美, 竹下和貴, 梁政寛, 2022. 日本全国の河川における水質測定地点 (環境基準点) の物理化学的特徴の整備とそれに基づくグルーピング. 水環境学会誌 45, 231-237.

ちょっと地道な整理(地点の紐づけや位置情報の確認)に時間がかかってしまいましたが、やっと、日本全国の河川の水質測定地点(環境基準点2925箇所)を対象に、物理化学的特徴を整備した論文がまとまりました。やったことはシンプルで、物理化学的特徴としては、集水域面積や標高,、集水域及び3 km周囲の土地利用割合、pH(最小値)、生物化学的酸素要求量、浮遊物質量、全リン、全窒素を整備しました。その後そのデータを使って、クラスター分析でひとまず4つのグループに分けてみたという感じです。詳しくは要旨や本文を御覧ください。「任意の化学物質の濃度が高い地点があったときに、それってどんなところ?」に答えられるデータベースのようなものを作りたいというモチベで始めましたが、きちんと成果になってよかったです。特に、小林さんにGIS解析全般を引き受けて頂き、ボクはとても助かりました(ありがとうございました)。本題とはずれますが、こっそりランダムフォレストによる欠損値の補完とかも使っています*1
整備したデータは、GitHubから落手可能です(ここ)。是非ご活用ください。

*1:科研費の申請書に書いたときから使ってみたかった。いやでも使いたいから使ったというわけではないです

末裔

久々に文庫本を読んだ気がする。なんというか、すごいのめり込んですぐに読み切ってしまうタイプではないんだけど、しっかり読みたくなる感じというか。良かったです。