Day 2: 9/12 Fri. 15:00 - 15:30
BC-212

Snowflake Intelligence × Document AIで“使いにくいデータ”を“使えるデータ”に

〜構造化データと非構造データを活用した次世代データ分析最前線〜

ナウキャストでは、オルタナティブデータをSnowflake上で加工・整備し、データプロダクトとして提供しています。これらのデータと比較対象として用いる企業の財務データは構造化されていないことが多く、機械的な処理が難しいという課題がありました。
本セッションでは、こうした非構造データ活用の課題に対してSnowflakeのAI機能をどう適用したかを、以下3つのアプローチでご紹介します。
・Document AI を用いたPDF文書からの情報抽出と構造化処理
・Streamlit in Snowflake を活用した、人の目による確認・補正を組み込んだ Human-in-the-loop ワークフローの構築
・Cortex Search による非構造情報のベクトル検索と自然言語での検索体験の実現
さらに、構造化データと非構造データを組み合わせて分析を行うにあたり、Snowflake Intelligence を活用したデータ分析レポート作成業務の効率化にも取り組みました。構造化データと非構造化データを横断する、AIを組み込んだ実践的データ分析ワークフローについて、リアルな知見をお届けします。

  • 2020年3月に大学院修了後、ナウキャストへ入社し主にPOSデータのパイプラインの作成・管理、またそのデータの分析を実施。現在では社内のデータ分析基盤開発チームのリーダーとしてAWSやSnowflakeのクラウド環境の整備や技術検証などを担当。データが好きで、KaggleではCompetition Masterを獲得したほか、複数の機械学習コンペで受賞歴あり。
    大野 巧作 氏
    株式会社ナウキャスト
    Data Service Platform Unit
    Data Platform Engineer
  • 北海道大学大学院にて、Material's Informaticsを先行。修士課程終了後、野村総合研究所にてASP型システムの保守運用業務、Snowflakeを用いたデータ活用基盤の開発業務に従事。2025年1月よりナウキャストに入社。
    向山 拓実 氏
    株式会社ナウキャスト
    Data Engineer / LLM Engineer