大規模データの活用によって社会における様々な問題を解決するためのアルゴリズムについて、主に理論的な観点から調査・研究開発を行います。
問題の系統としては、大規模データの統計解析による分類・予測や、物質に対する波の透過・反射の大規模観測データからその内部構造を推測する逆問題などを扱っています。また、これらに付随して、暗号についても関心を持っています。
統計解析については、遺伝情報を例にとると、ある遺伝情報を持つ人がどのような病気にかかりやすいのか、どのような薬が効きやすいのかなどを、事前に集めておいた大規模な遺伝情報を駆使するなどして判定する手法を開発する、といったイメージになります。
日常的な仕事内容は、問題の発見・定式化や、問題を解くために必要なアルゴリズムの調査、既存のものが不十分な場合にはアルゴリズムの考案や改良、そしてそれらの実証コードの作成、といった作業の繰り返しとなります。自然科学の各分野における専門知識が必要となってくる場合も少なくありません。
なお、リサーチエンジニアを大規模データ処理基盤エンジニアと比較しますと、前者はデータ「それ自体」に興味があるのに対し、後者はデータの「容れ物」に興味がある、と言うことができます。大規模データを格納するためのソフトウェアを作るのが大規模データ処理基盤エンジニアであり、そこに格納された大規模データを実際に活用するのがリサーチエンジニアです。
医療、バイオインフォマティクス、暗号といった、社会的意義の大きい分野に特に注力しているため、実働したシステムを通して、自身の考案したアルゴリズムが実際に社会の役に立っていることを実感できます。
また、大学や公的研究機関とも共同研究を行なっているため、学術的にも意義の大きな問題を扱うことができます。