get api keys on TD

Treasure Data

get api keys on TD コマンドでログインしているのが前提だけど。 $ td apikey:show YOUR_API_KEY_WILL_BE_HERE

2017-04-20

fluentdでbuffer_path重複

Treasure Data

よんでもあんまり理解できなかった tom-rc.hatenablog.com

2017-04-14

digdag 0.9.9

Treasure Data

バージョンのところ以外修正がない Release v0.9.9 · treasure-data/digdag · GitHub

2017-04-02

Digdag EMR

Treasure Data

emr>: Amazon Elastic Map Reduce — Digdag 0.9.5 documentation typeのところから一部抜粋。spark/hive/script/commandが使えると思う - type: hive script: queries/hive-query.q vars: INPUT: s3://my-bucket/data/ OUTPUT: s3://my-bucket/output/ hivec…

2017-01-12

Treasure Data Serviceの機能開発と安定運用の狭間におけるあれこれ #tdtech

Treasure Data

機能開発側のはなしシステムアーキテクチャのはなしいまどんなところに注力しているか信頼性確保アーキ (API server w/ RoR) * 4 w/ load balancer MySQL(JobQueue)/S3/RiakCS/MySQL(AccountDB) Worker(Ruby+Java) YARN Cluster(Hive/HDFS) / Presto Clu…

2017-01-12

ActiveRecord issues #tdtech

Treasure Data

ActiveRecord issues #tdtech kamipo activerecordについての話 rails issues team http://blog.steveklabnik.com/posts/2012-07-05-how-can-i-contribute-to-ruby-on-rails- Railsに2016年一番コミットした人なので、お前勝手にやれって言われた Rails 5.0→…

2017-01-12

メモ Stable large scale Presto cluster #tdtech

Treasure Data

Presto In TD TD API BI Tool HTTP から、クエリを投げる。 prestobase proxy node schedular(presto) resource group Prestobase proxy JDBC/ODBCはいけていないリプレイスするためのPrestobase Proxy HTTP接続するときにPrestoが使える Scalaで書かれてい…

2017-01-12

メモ DigdagによるRedshift + EMRの自動制御とデータ分析アプリケーションの開発 #tdtech

Treasure Data

digdag github.com (途中参加) ワークフローエンジン Aをやって、Bをやって、でもBが失敗したらCをやる、というのを、コードを書かないで制御するサーバーどこの環境でも動くことワークフローが手元でも動くステップを足す→ローカルで実行するサーバー…

2016-11-20

digdag pr 177

Treasure Data

workflowの実行リミットを1000回(デフォルト)に設定出来るようにするPRらしい github.com

2016-11-19

digdag command references

Treasure Data

digdag sessionsでstatusがerrorのやつだけを抜き出したかったのだけれど、そういうオプションは今はないらしい。 Command reference — Digdag 0.8 documentation

2016-11-17

fluentd v0.14.9

Treasure Data

リリースノート的なのはなかった。 Release v0.14.9 · fluent/fluentd · GitHub と思ったらここにあった。 Fluentd v0.14.9 has been released | Fluentd

2016-09-02

TDにおけるクエリのこつ

Treasure Data

時間指定すること。 blog-jp.treasuredata.com

2016-09-02

TDジョブ監視

Treasure Data

など。 td job:list -R NUM qiita.com

2016-08-31

td_time_range

Treasure Data

boolean TD_TIME_RANGE(int/long unix_timestamp, int/long/string start_time, int/long/string end_time [, string default_timezone = 'UTC']) startとendを指定できる。しかも文字列も可能だから、"2016-08-31 12:00"みたいな書き方も可能。そしてドキ…

2016-07-14

メモ The Real of Treasure Data Engineering Team #tdtech

勉強会 Treasure Data

シリコンバレーの会社で6割がた日本人どういうふうにチームを回しているのか VP of engineering vs CTO CTOはスーパーマン?? コードをかけて、マネジメントできて、最新の情報にキャッチして… ってそんなことはない。エンジニアのマネジメントとしてのVP o…

2016-07-14

メモ PlazmaDB/PlazmaGC #tdtech

勉強会 Treasure Data

PlazmaDBの各種ゴミ集め PlazmaDBについては良い資料があるので詳細はそちらをみる MessagePack 分析用DB インデックスは時間軸トランザクション暗号化サポート時間軸のメタデータデータの中身はS3 or RiackCS PlazmaDB 1秒間に110万行のimport 310Kのデ…

2016-07-14

メモ Treasure Dataを支える人々 #tdtech

勉強会 Treasure Data

技術的な話が多いので人にフォーカスしたはなしを分散系とかPrestoとかを担当 TDエンジニアの一日朝が早くない出社時間はまちまちだけど、slackとかあるので、そんなに苦ではないソースコードはGitHub→ステータスの管理はJIRA(GitHubのIssueは使いづらい…

2016-07-14

memo 3 Months Into Treasure Data #tdtech

勉強会 Treasure Data

日本語でセッション… TDに入る前 spotifyで働いていて、バックエンドの開発をやっていた dockerとかインフラとか CSの中でいちばん興味のあるのは分散システムとかパフォーマンスのところなんでTD cloud is eating the world 2011時点のspotifyのインフラは…

2016-07-14

メモバルクロードの信頼性を上げるための戦い #tdtech

勉強会 Treasure Data

Embulkとは Embulkのプラグインの話 TDでEmbulkをつかう話 OSSとして出しているプラグラブルなバルクロードツール Fluentdのバッチ版と言われる TDはOSSと一緒のバージョンを使っている cavのgzipをMySQLにアップロードする、といった用途とか GUIも使える I…

2016-07-14

メモ PerfectQueueはいかにパーフェクトか、あるいはRubyとMySQLでジョブキューを作る試みについて #tdtech

勉強会 Treasure Data

PerfectQueue パーフェクトな分散キュー worker scheduler consoleapiのやりとりで分散キュージョブキューとは first in frist out At-least-once semantics 最大1回実行ジョブキューにRDBMSを使うべきか使うべきなのでは At-most-once queueのテーブル構…

2016-07-13

TDのサンプルクエリ集

Treasure Data

こんなのがあるんですね。 examples.treasuredata.com で、ちょっと見てみると要ログインとのこと。

2016-07-07

td command-lineからPrestoのクエリを実行するの

Treasure Data

Tオプションだ！ -T, --type TYPE set query type (hive, pig, presto) つまり例としては、こう。 $ td query -d example_db -T presto -w -r rset1 "select count(*) from table1" 見つけ方なんだけど、ドキュメントを読んでもよくわからなかったので、ヘル…

2016-07-01

embulkことはじめ

Treasure Data

特段理由も無くただなぞるだけ。 github.com CentOS7で余裕でした。 curl --create-dirs -o ~/.embulk/bin/embulk -L "http://dl.embulk.org/embulk-latest.jar" chmod +x ~/.embulk/bin/embulk echo 'export PATH="$HOME/.embulk/bin:$PATH"' >> ~/.bashrc …

2016-06-22

getting started digdag

Treasure Data

なぞっていけばいいんじゃないかな。 Getting started — Digdag 0.8 documentation

2016-06-22

installing td cli on centos7

Treasure Data

docs.treasuredata.com $ curl -L https://toolbelt.treasuredata.com/sh/install-redhat-td-agent2.sh | sh

2016-06-15

td sample:apache <path.json>について

Treasure Data

docs.treasuredata.com Create a sample log file apacheのサンプルログをJSON形式で吐き出す。ちなみに、sample系はapacheだけ。ちな $ td table:import sample_db www_access --json apache.json でjsonデータをテーブルにimportできるけど、データの追加…

2016-06-14

td-client-javaをScalaで試したい

Scala Treasure Data

SQL文を指定して実行→OK(JobIdをプログラムで発行してジョブを実行する) JobIdを指定して実行→OK(過去ジョブの結果を直接呼び出しているので処理時間が異様に短い) SavedQueryからクエリ名を指定して実行→OK(JobIdをプログラムで発行してジョブを実行する) g…

2016-06-12

td-client-javaをScalaに移植したい

Scala Treasure Data

TreasureDataをJavaでごにょるライブラリがあるんで、Scalaに翻訳した。IDEはIntelliJです。 github.com READMEに書いてあるJavaのサンプル import com.treasuredata.client.*; import com.google.common.base.Function; import org.msgpack.core.MessagePac…

2016-06-11

tdインストール

Treasure Data

よりどりみどり。 Treasure Data Toolbelt | Treasure Data, Inc.

2016-06-07

td command-lineをなぞってインストール/td.conf

Treasure Data

MacでもLinuxでも公式からそのままなぞればおーけー。 td command-line とかでぐぐればいいです。 docs.treasuredata.com ちなみに、td -e https://api.treasuredata.com account -f でアカウント認証をする必要がありますが、面倒なので ~/.td/td.conf に…

by shigemk2

当面は技術的なことしか書かない

Treasure Data

get api keys on TD

fluentdでbuffer_path重複

digdag 0.9.9

Digdag EMR

Treasure Data Serviceの機能開発と安定運用の狭間におけるあれこれ #tdtech

ActiveRecord issues #tdtech

メモ Stable large scale Presto cluster #tdtech

メモ DigdagによるRedshift + EMRの自動制御とデータ分析アプリケーションの開発 #tdtech

digdag pr 177

digdag command references

fluentd v0.14.9

TDにおけるクエリのこつ

TDジョブ監視

td_time_range

メモ The Real of Treasure Data Engineering Team #tdtech

メモ PlazmaDB/PlazmaGC #tdtech

メモ Treasure Dataを支える人々 #tdtech

memo 3 Months Into Treasure Data #tdtech

メモバルクロードの信頼性を上げるための戦い #tdtech

メモ PerfectQueueはいかにパーフェクトか、あるいはRubyとMySQLでジョブキューを作る試みについて #tdtech

TDのサンプルクエリ集

td command-lineからPrestoのクエリを実行するの

embulkことはじめ

getting started digdag

installing td cli on centos7

td sample:apache <path.json>について

td-client-javaをScalaで試したい

td-client-javaをScalaに移植したい

tdインストール

td command-lineをなぞってインストール/td.conf