Table of Contents - rabbit-slide-kou-scipy-japan-2019-2019.4.23.2 Documentation
Pages
- README.rd
- Rakefile
-
apache-arrow.rab
- Apache Arrow
- Me
- Why do I talk at SciPy?n(('note:なぜSciPyで話しているのか?'))
- Apache Arrow
- Cross-languagen(('note:多言語対応'))
- Development platformn(('note:開発プラットフォーム'))
- For in-memory datan(('note:インメモリーデータ'))
- Apache Arrow and Pythonn(('note:Apache ArrowとPython'))
- Apache Arrow and men(('note:Apache Arrowと私'))
- Feature (1)n(('note:機能(1)'))
- Why effective?n(('note:なぜ効率的なのか'))
- Data format: Numbern(('note:データフォーマット:数値'))
- Compare to JSONn(('note:JSONと比較'))
- Merit of direct data usen(('note:データを直接使うことのメリット'))
- Performancen(('note:性能'))
- Zero copy and large datan(('note:ゼロコピーと大きなデータ'))
- Effective string representationn(('note:効率的な文字列表現'))
- Data format: Stringn(('note:データフォーマット:文字列'))
- Feature(?) (2)n(('note:機能(?)(2)'))
- Why do Arrow specify?n(('note:なぜArrowは仕様化するのか'))
- Effective data exchangen(('note:効率的なデータ交換'))
- Who uses Arrow format?n(('note:Arrowフォーマットをだれが使っているか'))
- CPU and GPU
- CPU and FPGA
- Spark
- PySpark
- PySpark with Arrow
- Feature (3)n(('note:機能(3)'))
- Optimized data processingn(('note:最適化されたデータ処理モジュール'))
- High performance (1)n(('note:高速化(1)'))
- Data localityn(('note:データを局所化'))
- High performance (2)n(('note:高速化(2)'))
- SIMD
- No condition branchn(('note:条件分岐なし'))
- Slide property
- FYI: nulln(('note:参考情報:null'))
- High performance (3)n(('note:高速化(3)'))
- Thread
- Apache Arrow and threadn(('note:Apache Arrowとスレッド'))
- High performance (4)n(('note:高速化(4)'))
- Compute kernelsn(('note:計算カーネル'))
- High performance (5)n(('note:高速化(5)'))
- Subgraph compiler: Gandivan(('note:サブグラフコンパイラー:Gandiva'))
- High performance (6)n(('note:高速化(6)'))
- Query enginen(('note:クエリーエンジン'))
- Query engine from Pythonn(('note:Pythonからクエリーエンジンを使う'))
- High performance (7)n(('note:高速化(7)'))
- Datasetsn(('note:データセット'))
- Fast datasetsn(('note:高速なデータセット'))
- Feature (4)n(('note:機能(4)'))
- RPC: Arrow Flight
- Wrap upn(('note:まとめ'))
- Next stepn(('note:次の一歩'))
- config.yaml