Yuki Maeda(前田 優希)

About Me

東京大学大学院 情報理工学系研究科 電子情報学専攻 田浦研究室に所属。修士1年。並列・分散処理を主とした高性能計算(HPC)分野に関心があり,研究を行っています。

趣味は野球観戦です。横浜 DeNA ベイスターズを応援しており,いわゆる暗黒時代からのファンです。他にもスポーツ観戦全般,音楽を聴くこと(特にJ-POP),旅行なども好きです。

野球観戦

2024年にDeNAが日本一になったときの写真。
運良く現地で観戦できました。

佐多岬

鹿児島県の佐多岬に行ったときの写真。

Research

並列性を備えたハードウェアの特性を深く理解したうえで,その特性を最大限に,かつ簡単に引き出すことのできるソフトウェア設計に関心があります。卒論研究として,GPU におけるタスク並列ランタイムの設計・実装に取り組みました(研究室 HP の研究紹介記事もご覧ください)。
キーワード:タスク並列,fork-join,work stealing,CUDA,Clang など

その他にも,以下の分野に関心があります(すべてに詳しいわけではありません)。

  • ドメイン特化の負荷分散アルゴリズム
    • 例:LLM 学習・推論における Grouped GEMM のスケジューリング,GPU 上での並列グラフ探索 など
  • LLM 推論・学習ワークロードの最適化
    • 例:MoE の Expert Parallelism における負荷不均衡の緩和,量子化等の低精度処理 など
  • ハードウェアに依存しない高水準な言語処理系

対外発表

  • Yuki Maeda, Kenjiro Taura.
    A GPU-Resident Fork-Join Task-Parallel Runtime.
    LATHC 2026.

プレプリント・コード

  • Yuki Maeda, Kenjiro Taura.
    GTaP: A GPU-Resident Fork-Join Task-Parallel Runtime with a Pragma-Based Interface.
    arXiv · GitHub

Works

研究に限らず,これまでに取り組んできたことの抜粋です。クリックして詳細を確認できます。

OpenMP Tutorial

B4 時の研究室内の勉強会のため,OpenMP を学習するためのチュートリアルを作成しました。スライドとともにサンプルコードを示しており,手元で動かしながら OpenMP の基本的な構文に関する学習を進めることができます。 各種指示文の機能だけでなく,指示文ごとのパフォーマンスの比較などにより,各種機能の使い所をなるべく明快に理解できるよう意図して作成しました。Github 上で公開しています。

COpenMP

Super Scalar In-Order Pipeline Processor Design

EEIC 3年後期実験「マイクロプロセッサの設計と実装」において,スーパースカラインオーダパイプラインプロセッサを設計しました。開発環境としては Vivado を使用し,FPGA へ書き込んだのち動作確認をしました。 スーパースカラは命令の同時実行可能性判定やレジスタファイルの改良など考える点が多く大変でしたが,最終的にはきちんと動くものが完成し達成感がありました。設計は Github 上で公開しています。

VerilogVivado

A Visualization of Manzai Combi Name

EEIC 3年後期実験「情報可視化とデータ解析」において,チーム開発により,M1グランプリに出場している漫才師のコンビ名を可視化するウェブサイトを作成しました。大規模なデータを可視化する手法を学ぶとともに,ウェブサイトを設計することでフロントエンドの基礎を学びました。 技術面では,selenium によるスクレイピング,D3.js を用いた情報可視化,React を用いたウェブサイトの作成などを行いました。

TypeScriptReactViteD3.jsPython

Atcoder Participations

アルゴリズムの勉強のため,Atcoder のコンテストに参加していました。

C++

Skills

Programming Languages
  • 主に使用するのは C/C++/Python です(研究・実装の中心)。
  • 大学の課題として,Rust で minc コンパイラを設計したことがあります。
  • 研究の一部分として,Clang の Parsing/AST/Semantics を拡張した経験があります。
HPC
  • 研究では CUDA を用いて,GPU 上で動作するタスク並列ランタイムを開発しています。
  • 大学の授業で OpenMP/MPI を用いたハイブリッド並列の実装経験があり,スーパーコンピュータ上で LU 分解を MPI 56プロセス × OpenMP 4スレッド(計224スレッド)で並列化しました。
  • Triton で簡単なカーネルを記述できます。
  • 並列プログラミング言語 Chapel を学習しており,設計思想と基本的な文法を理解しています。
Machine Learning & LLMs
  • PyTorch が使えます。
  • HuggingFace Transformers 等を用いて,LLM の fine-tuning および推論を行った経験があります。
  • 関連して,Nsight Compute,Nsight Systems,PyTorch Profiler 等のパフォーマンス解析ツールの使用経験があります。
Computer Architecture
  • Verilog により,スーパースカラインオーダパイプラインプロセッサを設計した経験があります。開発環境としては Vivado を使用し,FPGA へ書き込んだのち動作確認をしました。
Misc.
  • 2025年5月,応用情報技術者試験を取得しています。
  • TOEFL iBT スコア:93/120 (2025年5月)
  • このホームページを作れる程度には,TypeScript,React,Vite 等のフロントエンドスタックを扱えます。

Biography

学歴

  • 2019年4月 – 2022年3月:開成高等学校
  • 2022年4月 – 2026年3月:東京大学 工学部 電子情報工学科
    • 優秀卒業論文賞 受賞
  • 2026年4月 – 現在:東京大学大学院 情報理工学系研究科 電子情報学専攻

職歴