坂平 文博 准教授

大阪工業大学 情報科学部 データサイエンス学科

文理の垣根を越えデータサイエンスで歴史の謎も解き明かす

FLOW No.95

坂平 文博
Profile
さかひら・ふみひろ 2001年南山大学文学部人類学科卒業。2003年名古屋大学大学院人間情報学研究科博士前期課程修了。2007年同大学院情報科学研究科博士後期課程単位取得後退学。同年構造計画研究所入社。働きながら2018年東京工業大学大学院総合理工学研究科博士後期課程修了。甲南大学経営学部や同志社大学大学院総合政策科学研究科、東京大学経済学部などで非常勤講師を歴任。2021年から現職。博士(工学)。兵庫県出身。

再現性があり、反証可能な歴史研究を目指す

コロナ禍ではビッグデータを活用したデータサイエンスの成果がニュースで目立ちました。繁華街での人流分析や感染拡大の予測、ワクチン開発にも使われています。更には今年のノーベル物理学賞を受賞した真鍋淑郎・米プリンストン大上席研究員の「地球温暖化予測の気候変動モデル開発」はスーパーコンピューターを駆使したまさにデータサイエンスでもあります。大阪工大情報科学部に今春新設されたデータサイエンス学科の坂平文博准教授は、そのデータサイエンスを使って伝統的な文系分野だった人類学や考古学で新たな研究手法を確立しようとしています。文理融合を体現する坂平准教授に、歴史の謎をデータサイエンスで読み解く面白さなどを聞きました。

きっかけは旧石器捏造事件

私は歴史の中でも人間の生活に密着した事象を扱う人類学・考古学を学ぼうと大学の文学部人類学科に入学しました。伝統的なやり方で古墳から出土した馬具の文様の研究などをしていましたが、2000年に起きた旧石器捏造事件*=注1=に衝撃を受けました。歴史研究にもっと科学的で客観的な手法が必要と意識するようになったきっかけでした。人類学や考古学の研究には、再現性(誰がやっても同じ結果となる研究手法)と反証可能性(後からどんな資料が出れば仮説が否定されるかを提示できるか)*=注2=がまだ不十分と考えるようになりました。個々の資料の発見や仮説の提示だけに終わらず、他の研究者にオープンな形でフィードバックできる手法が必要です。大学院の時には古人骨のDNA分析という科学的手法を取り入れましたが、資料への接近の方法に制限があり、資料依存性が高いものでした。メディアでは遺跡などから出る1つの資料に注目が集まりますが、学問としては1つの資料より、さまざまな資料群のパターン認識こそが重要なのです。

その後、企業や行政が抱える課題に対して、人間の行動とその背後にある考えを分析してコンサルティングする会社に就職しましたが、そこでデータサイエンスに出会いました。中でも、避難シミュレーションなどに使われていたエージェント・ベース・モデリング(ABM)という社会シミュレーションの手法を知り注目しました。この手法こそが更なる再現性と反証可能性を人類学や考古学にもたらすと考え、ABMが専門の東京工業大の寺野隆雄教授(現・千葉商科大)のもとで社会人大学院生として学び、人類学・考古学の仮説生成と仮説検証にABMを用いた新しい手法を導入しようと研究しました。

ABMでビッグデータを作る

ABMというのは、コンピューター上のエージェント(人やグループ)にそれぞれあらかじめ個別の行動のルールを与えて配置し、コンピューター上の仮想社会で行動させ、相互作用させて集団全体の振る舞いを再現することで、社会現象の仕組みを探索するシミュレーション手法です。考え方自体は1970年代には生まれていましたが、コンピューターの進化で超高速に膨大なデータを扱えるようになった1990年代半ば以降に一気に発達しました。交通渋滞やパニック、株価暴落、感染拡大など、人と人の相互作用の積み重なった結果、大きく変動する事象の理解にとても有効です。

人類学・考古学では、土器や石器などの遺物、建物跡である遺構、人や動植物のDNAや化学物質などが基本的データになります。それら属性の異なる情報を多数集めるとビッグデータとなります。しかしながら、残っている情報はどうしても多くはありません。従来、失われた情報を人間の類推で補っていたのですが、より強力な手段としてABMのような手法でシミュレーションします。そうやって出力されたシミュレーションの結果も仮想のビッグデータです。いわば作られたビッグデータです。数少ない資料からの人間による仮説の類推には限界があり、偏りもありますが、ABMではコンピューターで誰がやっても同じ結果が出て、しかも数万通りのパターン・仮説を提示できます。更に、シミュレーションをやりっぱなしではなく、シミュレーションの途中経過を観察することで反証する方法を示すこともできます。つまり、いくつかの仮説のうち、どの時点でどんな資料が発見されたらどの仮説が支持されるか(または反証されるか)ということをフィードバックもできます。新たな発見へのガイドにもなるのです。ABMによって、人類学や考古学の研究手法に再現性や反証可能性を実現できるのです。

古代人の行動をシミュレーション 縄文~弥生期の人口置換の謎に迫る

具体的に私が取り組んだ研究は、「北部九州における弥生農耕の主体の問題」でした。九州大の中橋孝博名誉教授らによると、縄文時代から弥生時代にかけての北部九州では縄文人から渡来系の弥生人への人口置換が起きました。縄文晩期には縄文人の人骨が多く出土していますが、400~500年後の弥生中期には渡来人系の弥生人の人骨が多く、1:9から9:1にその比率が逆転したのです。その置換原因について従来の学説は、狩猟採集民族(縄文人)より農耕民族(弥生人)の人口増加率が高いという前提のもとに数学的に説明しています。私はその学説では2つの集団間の農耕文化の伝播や交雑が考慮されておらず、非現実的だと考えました。

そこでABMを使って一人一人の古代人を作り、文化の伝播や結婚、出産などの要素を入れてシミュレーションすることで人口置換の説明ができないか試みたのです。その結果、人口置換が起きる2つのパターンが分かりました。1つは農耕文化の普及スピードが遅い場合(縄文人に農耕文化が伝わりにくい)で、その場合は「全期間にわたり農耕の主体は渡来系弥生人」という仮説が立てられ、人口置換が起きました。2つ目は農耕文化の普及スピードが速い場合(縄文人に農耕文化が浸透した)で、「弥生時代初期に縄文系弥生人が農耕主体として重要な役割を担った」という仮説が成り立ち、この場合でも弥生中期に人口置換が起きました。人口置換はどちらでも説明できるのです。もし後者の仮説が正しいなら、縄文系人骨と農耕文化を示す資料が一緒に出土する遺跡があることが検証可能事項になりますが、実際に佐賀県の大友遺跡では、縄文系形質の埋葬者が安定同位体分析で穀物依存であったことが分かっています。

このようにABMでは残っている資料をもとに仮説をいくつも提示できるうえ、それぞれの仮説を補強したり、否定したりできる資料が何かを示し、将来の発掘や研究の進展につなげられるのが画期的です。

結果は意外でも道理は意外でない魅力

今年8月出版された共著
『プロ野球「熱狂」のメカニズム』(東京大学出版会)

今やデータサイエンスはあらゆる分野で活用されています。私も歴史研究の他に、過去の大震災の新聞記事データから網羅的な災害連鎖を浮かび上がらせる「カスケード災害の分析」や、プロ野球でチーム構成や選手同士の関係によって成績がどう変わるかなどの「スポーツマネジメント」もテーマに研究しています。それぞれデータによって分析手法も変わります。例えば、建築業界など昔から法律によってデータが保存・蓄積されている分野では、今後データサイエンスの活躍が期待できます。ただしデータのデジタル化、いわゆるデジタイゼーションも必要です。

ある問題について、データサイエンスのアプローチを用いると、意外な答えや仮説が見えてくることがあります。その意外性も、誰もが再現可能なものとして客観性を持って提示できます。結果は意外でもその道理は意外でないという面白味がデータサイエンスにはあります。特に、再現性はそもそもサイエンスにとって不可欠な要素なので、人文科学研究においてそれを追求することは、非常に価値があることです。






*注1【旧石器捏造事件】=2000年11月、東北旧石器文化研究所(解散)の元副理事長が自らの手で石器を埋めていたことを毎日新聞がスクープ。元副理事長は東日本各地の発掘現場で同様の工作をしたことを認め、歴史教科書を書き換える古代史研究の一大スキャンダルとなった。

*注2【反証可能性】=科学哲学者カール・ポパー(1902-94)の重要なテーゼ。「科学的仮説は自らが誤っていることを確認するテストを考案し、実行することができる」というもの。似非科学を排除する基準ともなる。

ニューウェーブ