- api-change:
ds
: Update ds command to latest version
digdag 0.9.30
- Add options to customize _retry behavior [#852]
- Upgrade okhttp to 3.9.0 for td-client [#881]
(なんかタグ付けされるの遅くないですか…)
memo Redash Query Runner Athena
RedashのPrestoクエリランナーには当然pyathenaを使っているけど、本家のドキュメントがあまり充実していないからなのか、Athenaに対して実行できるクエリを制限する方法がよくわからない
redash/athena.py at 53abc1678045c89fe619cb1581e52321e6abc8df · getredash/redash · GitHub
memo Presto LEFT OUTER JOIN
LEFT OUTER JOINのON条件で複数マッチしたときは、掛け算になる。下のようなクエリがあったとして、idで外部結合しようとしているけど、idがそれぞれ2つあるので、id=1については 2 * 2
で4つの組み合わせができる。
SELECT * FROM ( SELECT id, name, age FROM ( VALUES (1, 'alpha', 10), (1, 'alpha', 10), (2, 'beta', 20)) AS t (id, name, age)) a LEFT OUTER JOIN ( SELECT DISTINCT id, name, country FROM ( VALUES (1, 'alpha', 'JP'), (1, 'alpha', 'JP'), (2, 'beta', 'US')) AS t (id, name, country)) b ON a.id = b.id
絵文字テスト
🦐🦐🦐
train_test_split
- データを、テストデータと訓練データに分割
- test_size テストデータの分割割合 だいたい2割-3割
- train_size テストデータの分割割合
- shuffle データ
- RandomState 乱数制御
sklearn.model_selection.train_test_split — scikit-learn 0.20.0 documentation
awscli 1.16.24
- api-change:
codestar
: Update codestar command to latest version - bugfix:s3: Fixed a bug where
--sse-c-key
and--sse-c-copy-source-key
were modeled as string values rather than bytes values, which make them impossible to use on python 3 unless your key happened to be all unicode. - api-change:
ec2
: Update ec2 command to latest version
tesseract
導入はここ(MacとかLinuxの各ディストリとかあらかた書いてる) なお、OS(というかパッケージ管理)によって入れられるtesseractのバージョンは違う
Home · tesseract-ocr/tesseract Wiki · GitHub
日本語のtraineddataはここ traineddataのバージョンに気をつけてダウンロードして、所定の場所に置くこと Ubuntu18.04だと4.0.0-beta.1
が入り、/usr/share/tesseract-ocr/4.00/tessdata/
にtraineddataが格納されていた
tessdata/jpn.traineddata at master · tesseract-ocr/tessdata · GitHub
実行はこんな感じ。
$ tesseract test.png out -l jpn
fish shell seq
toいるかとおもったらtoいらない
for x in (seq 5 10) echo $x end
How to iterate for loop with limiting sequence in fish shell - Stack Overflow
Excelの日時をunix timestampに変換
# 変換日時がJST =(($a$1 - 25569) * (60 * 60 * 24)) - (60 * 60 * 9) # 変換日時がUTC =(($a$1 - 25569) * (60 * 60 * 24))
DATEDIF関数は日毎での比較なので、秒単位で比較したい場合は、いったんunixtimstampに変換するなどしたほうがいいかも。
Redash access_permissions
access_permissionsのテーブル定義まわりがこのあたりに記載されている。
redash/models.py at b1f5d60460664b4f604f2fa699b0814f8b701416 · getredash/redash · GitHub
widgetsやdashboardsの権限情報をここで保持している。 grantor_idが権限を付与したユーザーIDで、grantee_idが権限を付与されたユーザーID。
dashboardsの権限一覧はこんなクエリで取ることができる。
SELECT dashboards.id, dashboards.name, access_permissions.grantor_id, grantor_users.name AS grantor_name, access_permissions.grantee_id, grantee_users.name AS grantee_name FROM access_permissions INNER JOIN dashboards ON access_permissions.object_id = dashboards.id INNER JOIN users grantor_users ON access_permissions.grantor_id = grantor_users.id INNER JOIN users grantee_users ON access_permissions.grantee_id = grantee_users.id WHERE object_type = 'dashboards'
How-To-Open-a-Homebrew-Pull-Request
読めばいいのだけれど、あんまり brew bump-formula-pr
使わない。。。(Prestoとかawscliとか出来ない)
brew/How-To-Open-a-Homebrew-Pull-Request.md at master · Homebrew/brew · GitHub
awscli 1.16.20
- api-change:
cloudfront
: Update cloudfront command to latest version - api-change:
ec2
: Update ec2 command to latest version - api-change:
ds
: Update ds command to latest version