by shigemk2

当面は技術的なことしか書かない

pythonでオフィス快適化計画

Excelでの書類入力にイライラしない
社会人としてWordとどう付き合うか
ルーチンワークからの解放
xlsx docxとか

なぜ社会人はExcelで書類を作りたがるのか

(あー履歴書とか領収書とかで見たことあるー)
大人の世界は論破してもだめだよ

総務のひとと仲良くするためのPython
(R使えばいいんじゃないか?というソリューションはこのさい…)

pubmd
医学 生物学分野の学術文献検索サービス
(Google Schalarの医学版)

欲しい文献がない場合
図書の係の人に大学図書館に出向いてもらって複写してもらっていた

Excelのフォーマットに情報をぶっこむのは結構げんなりする

複写してほしい論文が何十もあるとしんどい
OpenPyXL + BioPython

OpenPyXL xls / xlsmを読み書き
PyOpenXLを使うことで既存のExcelファイルをテンプレートとした入力作業を自動化できる

時間の節約
無駄な作業からの開放(図書係のひとの作業がパンクして脱Excelへ動き始めた)

xlrd(read)
xlwt(write)

読み書きできるので既存のExcelファイルをテンプレートとして編集したあと
別のファイルに読み書きできる

wordで報告書とかごにょごにょ書く必要がある
でも、そもそも読まれるのだろうか
このフォーマットで書くのも面倒だし
トレーサビリティも重要
wordフォーマットでファイルを作って深いフォルダに入れる謎ルール
そこにアクセスするのもそこにフォルダに突っ込むのも面倒

FSWiki
perlで書かれたwikiエンジン
タグで分類
XML-RPCに対応
pdfで出力できる(wordで出せという要求をプラグインで解決)

docのテンプレートで埋め込む

コンテンツはできるだけシンプルな記法で持っておく
VCSと相性がいい
フォーマットの変換が簡単にできるようにしとく

docにするとコンテンツの再利用性が下がる
(wordを立ち上げる時間も馬鹿にならない)
ファイルの管理コストも結構高い

doc(x)でコンテンツを管理しないというスタイル(Sphinx)に転向した

pdfやepubだでなくdocxに出力することも出来る

officeopen xml (xmlのもろもろをzip圧縮)
xlsx
pptx
docs

Macでやりました
プロジェクトを作る — Python製ドキュメンテーションビルダー、Sphinxの日本ユーザ会
(homebrewだと別のsphinxがインストールされてしまう)

pip install sphinx
sphinx-quickstart

いろいろ聞かれるけど、
プロジェクト名とバージョン番号と著者の名前を適当にやっておいて、
あとはEnterで可

hoge.rst

=========================
hogehoge
=========================

:著者: hoge
:出版社: hoge

内容

hogehoge
$ make html

Office文書をPythonで生成することのメリット

煩わしい手作業を自動化できる
プロセスを再利用できる
Gitで管理できる

Pythonを使うといいかもしれない