Table of Contents - rabbit-slide-kou-rubykaigi-takeout-2021-2021.9.11.3 Documentation
Pages
- README.rd
- Rakefile
- config.yaml
-
red-arrow.rab
- Red Arrow
- Sutou KouheinA president Rubyist
- Sutou KouheinAn Apache Arrow contributor
- Sutou KouheinThe pioneer in Ruby and Arrow
- GObject Introspection?
- Why do I work on Red Arrow?n(('note:なぜRed Arrowの開発をしているか'))
- Goal of this talkn(('note:このトークのゴール'))
- Red Data Tools project?
- Data processing?
- 0. Why do you want?n(('note:0. データ処理の目的を明らかにする'))
- 1. Collect datan(('note:1. データ収集'))
- Common datasetn(('note:よく使われるデータセット'))
- Output: Local filen(('note:出力先:ローカルファイル'))
- (({#save}))
- (({#save})): Implementation
- (({#save})): Implementation
- (({#save})): Extend by Red Parquet
- (({#save})): Extended
- Output: Online storage: Fluentdn(('note:出力先:オンラインストレージ:Fluentd'))
- Output: Online storage: Red Arrown(('note:出力先:オンラインストレージ:Red Arrow'))
- (({#save})): Implementing…
- Collect data w/ Red Arrow: Wrap upn(('note:Red Arrowでデータ収集:まとめ'))
- 2. Read datan(('note:2. データ読み込み'))
- Formatn(('note:フォーマット'))
- (({.load}))
- (({.load})): Implementation
- (({.load})): Implementation
- (({.load})): Extend by Red Parquet
- (({.load})): Extended
- (({.load})): More extensible
- (({.load})): Extend by Red Arrow Dataset
- Location: Online storagen(('note:場所:オンラインストレージ'))
- Location: RDBMSn(('note:場所:RDBMS'))
- Location: Networkn(('note:場所:ネットワーク'))
- Large datan(('note:大規模データ'))
- Fast load: Benchmarkn(('note:高速ロード:ベンチマーク'))
- Fast load: Benchmark: Alln(('note:高速ロード:ベンチマーク:すべて'))
- Slide properties
- Fast load: Benchmark: Red Arrown(('note:高速ロード:ベンチマーク:Red Arrow'))
- Slide properties
- How to implement fast loadn(('note:高速ロードの実装方法'))
- Read data with Red Arrow: Wrap upn(('note:Red Arrowでデータ読み込み:まとめ'))
- 3. Explore datan(('note:3. データ探索'))
- Filter: Red Arrown(('note:絞り込み:Red Arrow'))
- Filter: Performancen(('note:絞り込み:性能'))
- Filter: Performancen(('note:絞り込み:性能'))
- Slide properties
- Apache Arrow data: Interchangeablen(('note:Apache Arrow data:交換可能'))
- Filter: DuckDBn(('note:絞り込み:DuckDB'))
- Summarize: Group + aggregationn(('note:要約:グループ化して集計'))
- Visualize: Chartyn(('note:可視化:Charty'))
- Visualize: Charty: Resultn(('note:可視化:Charty:結果'))
- Slide properties
- 4. Use insightn(('note:4. 知見を活用'))
- Data processing and Red Arrown(('note:Red Arrowでデータ処理'))
- Red Arrow and Ruby 3.0
- MemoryView
- Numeric arrays in Red Arrown(('note:Red Arrow内の数値配列'))
- MemoryView: Red Arrow
- MemoryView: C++
- Ractor
- Red Arrow and concurrencyn(('note:Red Arrowと並列性'))
- Ractor: Red Arrow
- Ractor: Red Arrow: Benchmark
- Ractor: Red Arrow: Benchmark
- Slide properties
- Wrap upn(('note:まとめ'))
- Goal of this talkn(('note:このトークのゴール'))
- Feature workn(('note:今後の仕事'))
- Red Data Tools
- OSS Gate on-boardingn(('note:OSS Gateオンボーディング'))
- ClearCode Inc.