著者:Denny Lee, Tristen Wentling, Scott Haines, Prashanth Babu, 長谷川 亮, 倉光 怜
出版社: オライリー・ジャパン
ISBN: 9784814401390
発売日: 2025年11月19日頃
Delta Lakeで築く、次世代データ基盤の教科書!
本書は、データエンジニア、データサイエンティスト、データアナリスト向けに、Delta Lakeを活用して信頼性の高いデータレイクハウスを本番環境で運用するための実践的なガイドです。ベストプラクティス、最適化技術、実際のシナリオが含まれており、大規模なDelta Lakeベ……
続きを見る
著者:Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee, 長谷川 亮, 弥生 隆明
出版社: 翔泳社
ISBN: 9784798182285
発売日: 2024年04月12日頃
統合型アナリティクスエンジンの仕組みとビッグデータの大規模処理を徹底解説。基本操作からDelta LakeやMLlibを利用したパイプラインの構築まで紹介。
続きを見る
著者:Ken Youens-Clark, 中山 光樹
出版社: オライリー・ジャパン
ISBN: 9784814400584
発売日: 2024年01月18日頃
難しいRust、たくさん書いて、たくさん学ぶ!
Rustは速度や安全性、並行性に優れたプログラミング言語で、ゲームエンジン、オペレーティングシステム、ブラウザなど、さまざまな分野で使われています。Rustは学習が難しい言語だと言われていますが、本書では小さなコマンドラインツールを多数書くことを通じて、Rustの機……
続きを見る
著者:Qiang Yang, Yang Liu, Yong Cheng, Yan Kang, Tianjian Chen, Han Yu
出版社: 共立出版
ISBN: 9784320124950
発売日: 2022年10月25日頃
複数のデータ所有者が、各自の持つ学習データを秘匿したまま、協力して機械学習モデルを構築するにはどうすればよいだろうか? 従来型の機械学習のアプローチでは、すべてのデータを1か所(通常はデータセンター)に集める必要がある。
しかし、これはユーザーのプライバシーやデータの機密性に関する法律に違反する可……
続きを見る
著者:Tomasz Drabas, Denny Lee, Sky株式会社 玉川 竜司
出版社: オライリー・ジャパン
ISBN: 9784873118185
発売日: 2017年11月22日頃
Apache SparkをPythonから使うための方法とノウハウを網羅!
PySparkとはSparkを実行するためのPython APIです。インメモリ(ソフトウェアを実行する際、使用するプログラムやデータのすべてをメモリ上に読み込み、ハードディスクなどの外部記憶装置を使わないこと)で高速に分散処理ができるフレームワークで、MLlibとい……
続きを見る
著者:Ken Youens-Clark, 異業種データサイエンス研究会
出版社: オライリー・ジャパン
ISBN: 9784814400379
発売日: 2023年06月27日
実践課題と共にバイオインフォマティクスのPythonを学ぶ!
Pythonが再現性のある科学的なプログラムを書くのに適していることに焦点を当て、文書化、テスト、再現可能なソフトウェアを作成する方法を示します。大きく2部構成に分かれ、第I部ではバイオインフォマティクスとプログラミングを学習するためのプラットフォー……
続きを見る