2024年8月29日木曜日

データサイエンスにおける研究テーマの設定(学生向け)

 研究テーマの設定は重要であり、誰もが悩むことだと思います。今回はデータサイエンスにおける研究テーマの設定についてお話します。

データサイエンスの基本要素は、データ処理、コンピューティング、確率・統計・機械学習の理論です。この基本要素をベースに、社会の課題解決を図っていきます。また共同研究も多いためその場合はそのままテーマが決まりますが、自分でテーマ設定をすることは、悩みも多いと思います。

多分学生さんがテーマを設定するときに、「これで研究になるのだろうか?」、「これでは作っただけ?」、「新規性がないと研究でない?」などを考えるのではないかと思います。


(1) 研究レベルを確認する

一口に研究といっても、卒業研究からジャーナル投稿レベルまで様々なレベルがあります。自身の立場からどのレベルを目指すのかを確認しましょう。卒業論文なら研究室に過去のものがあると思いますし、ジャーナルでも見られる論文はたくさんあります。


(2) 自分の興味のある課題を探す・見つける

研究は日々苦労があります。それをやり続けるためには、自分が興味のあるテーマが一番です。現在は技術進歩が速く、不可能と思われることでもある程度は実現可能な場合もあります。精度の問題は最後までついてきますが、自分の興味あるテーマを見つけられれば幸せです。

データサイエンスという面で考えると、社会の課題解決を目標の一つとするので、色々な立場の方々と話をすると、その分野の課題感が見えてきます。それが研究テーマにつながったりします。

またデータサイエンスでは、データから研究を行うデータドリブンの場合も多いです。自分や研究室でデータがある場合、その分析を主目的とすることで、研究として仕上げていく場合も多いです。また近年はオープンデータも質の良いものが多くなっており、十分研究に利用できるものも多いです。僕自身、オープンデータを用いて、論文を提出しています。

どうしても研究テーマが自分で決められない場合は、研究室の先生に相談するのが良いでしょう。研究室で活動しているテーマを紹介してもらうと、研究が進めやすいです。(実はテーマ紹介をすることは非常に多いです)


(3) 参考文献を探す・見つける

テーマ候補が見つかったら、参考文献を探して、テーマに対してどのように研究を行なっているかを確認します。僕が一つの研究を行うときには、最低50本の参考文献を調査して、自分の論文の位置付けを明確にします。1日1本の参考文献を地道に調査して、整理することが重要です。論文にこの調査した参考文献に対して自分の研究の位置付けをはっきりさせましょう。自分の研究の特徴を明確に記述できるといいですね。


(4) 外部発表にチャレンジする

卒業研究、修士論文、博士論文など学内に発表機会が用意されていると思いますが、学会発表などの外部での発表は、自身の実績にもなりますし、色々な意見ももらえますので、チャレンジすると大変な面はありますが、メリットも多いです。期日も決まっていますので、学会発表をターゲットに研究を整えていくと、後々学内での活動に非常に役立ちます。(指導教員も外部発表は責任が伴うので、きちっと指導してくれると思います) また国際会議も視野が広がるので、機会が許せばチャレンジするといいでしょう。僕自身、英語での発表で特に質疑での受け答えは、僕自身の英語力を大きく向上させてくれました。


(5) 研究の姿勢

研究はやはり精度が向上しないと中々結果につながりません。データサイエンスにおいて、やはり研究精度を向上するには、基本要素である、データ処理、コンピューティング、確率・統計・機械学習の日々の研鑽が必要です。この知識は、どのような場面でも効果的なスキルですので、学生のうちに身につけてもらいたいです。

研究は日々苦労が多く、進めていくことが大変なときが多いです。しかし継続的に時間をかけていけば、結果につながるときが非常に多いです。学生時代の研究では、どれだけ時間をかけられたかに研究内容が比例するように思えます。自分の研究に対して、じっくり時間をかけて取り組んでもらいたいです。僕自身も、一歩でも前進するように、日々取り組んでいます。


0 件のコメント:

コメントを投稿