[B! データレイク] ikosinのブックマーク

ikosin id:ikosin

データレイクに関するikosinのブックマーク (21)

Onehouse - The Universal Data Lakehouse
ikosin 2025/05/01
データレイク
リンク
OpenHouse | OpenHouse
ikosin 2025/05/01
データ統合

データレイク
リンク
触ってわかるデータレイクハウス（Parquet, Iceberg, Trino）
この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の79週目の記事です！ 2年間連続達成まで残り27週となりました！昨今、データエンジニアリングの重要性が高まるなか、データレイクハウスという言葉を聞く機会が増えてきました。一方で、BI、DWH、データレイクといった分野は、色のついた商用製品であったり大規模な技術スタックになったりと気軽に触りにくい印象があったりもして個人的に最近はあまり触れてこなかった分野でした(15年程前はだいぶBI製品にお世話になりましたが)。でも、実はかじってみると美味しい、単なる食わず嫌いだったかもしれません。この記事では前半にデータレイクハウスを概観しつつ後半に軽くハンズオンしてみたいと思います。チョイスは、最も使われるフォーマットである Apache Parquet 、S3 Tables の元となっている Apach
ikosin 2025/02/24
データレイク
リンク
Paimon 1.0: データとAIのための統一されたレイク形式 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 本記事はこちらのブログを参考にしています。翻訳にはアリババクラウドのModelStudio(Qwen)を使用しております。 Apache Paimon: 統合データレイクストレージソリューションの洞察この記事では、Apache Paimonという統合データレイクストレージソリューションについて紹介します。特に、ビッグデータシステムにおける主要な課題への対応、なぜApache Paimonがこれらの問題の解決策になるのか、中国での採用状況、そしてさまざまなデータ処理とAI 技術との統合について焦点を当てます。ビッグデータの実践者たちは
ikosin 2025/02/18
データレイク

datastreaming
リンク
Paimon 1.0: Unified Lake Format for Data + AI
ikosin 2025/02/17
データレイク
リンク
Apache Paimon: the Streaming Lakehouse
ikosin 2025/02/17
データレイク
リンク
re:Invent 2024: AWSがS3 Tablesを発表 - 大規模表形式データ管理の新機能
はじめに海外の様々な講演を日本語記事に書き起こすことで、隠れた良質な情報をもっと身近なものに。そんなコンセプトで進める本企画で今回取り上げるプレゼンテーションはこちら！ 📖 AWS re:Invent 2024 - [NEW LAUNCH] Store tabular data at scale with Amazon S3 Tables (STG367-NEW) この動画では、Amazon S3の新機能「S3 Tables」について詳しく解説しています。S3 TablesはAmazon S3上で完全マネージド型のApache Icebergテーブルを提供し、表形式データの保存と管理を効率化するサービスです。従来のバケットと比較して最大10倍のトランザクション/秒を実現し、自動圧縮機能によりクエリパフォーマンスを最大3倍高速化できます。AWS Glue Data Catalogとの自動
ikosin 2025/02/07
データレイク
リンク
[PODLINGNAMESEARCH-209] Establish whether "Apache Paimon" is a suitable name - ASF JIRA
ikosin 2025/02/06
データレイク

命名
リンク
Building a Streaming Lakehouse: Performance Comparison Between Paimon and Hudi
ikosin 2025/02/06
データレイク

datastreaming
リンク
From Kappa Architecture to Streamhouse: Making the Lakehouse Real-Time
ikosin 2025/02/06
データレイク

datastreaming
リンク
The Streamhouse Evolution
ikosin 2025/02/06
データレイク

datastreaming
リンク
The Rise of The Streaming Data Lakehouse – bytewax
ikosin 2025/02/06
データレイク

datastreaming
リンク
Fluss | Fluss
ikosin 2025/02/06
データレイク

datastreaming
リンク
GitHub - dipankarmazumdar/awesome-lakehouse-guide: Repo for everything open table formats (Iceberg, Hudi, Delta Lake) and the overall Lakehouse architecture
ikosin 2025/02/06
データレイク
リンク
Apache Paimon vs. Apache Iceberg: A Detailed Comparison
ikosin 2025/02/06
データレイク

datastreaming
リンク
Comparing Apache Iceberg to Other Data Lakehouse Solutions | Dremio
ikosin 2025/02/06
データレイク
リンク
LAKEKEEPER
ikosin 2025/02/04
分析

データ統合

Rust

データレイク
リンク
Envisioning LakeDB: The Next Evolution of the Lakehouse Architecture
ikosin 2025/02/04
データ統合

データレイク
リンク
LakeDB - Next Generation Data Architecture
ikosin 2025/02/04
データレイク
リンク
OTFSG Tokyo Meetup #2 で「Kafka ConnectのIceberg Sink Connector」をテーマに発表してきた - MicroAd Developers Blog
マイクロアドの京都研究所からリモートで働いているインフラ開発ユニットの永富 id:yassan0627 です。 3/1に開催されたOpen Table Format Study GroupのMeetupの第2回目にて、「Kafka ConnectのIceberg Sink Connector」をテーマに話してきました。今回は、その紹介です。 otfsg-tokyo.connpass.com Open Table Format Study Group（OTFSG）について私の発表について Kafka Connectとは Iceberg Sink Connectorとはお試し環境について私以外の発表について最後に Open Table Format Study Group（OTFSG）について Open Table Format Study Groupは、以下を目的とする勉強会で
ikosin 2025/02/04
データ統合

データレイク

datastreaming
リンク
1 2 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx

Лучший частный хостинг