RPA (Web情報回収007_データ操作_文字列の置換、分割)

■取得した文字列を加工する
前回でhtmlタグから必要な情報を持ってこれたので、今回はそれを加工する。
アクションの中には、PythonやVisual basicといったプログラミング言語を使うものもあるので、文字列を操作する方法はいろいろありそう。ここではRPAの試しとしてアクションの中にあった文字列を使ってみる。


まず、この中の「置換」を使って不要なTabや改行を削除した。Tabや改行は、それぞれ$String:Tab$、$String:Enter$といった形で表現される。きれいにした状態が下のもの。

ここで、1行目は商品名(Name)、2行目はカロリー(Cal)、3行目は価格(Price)、4行目は発売日(Sale)、5行目は備考(Note)といった感じかなー。
データとして取り扱うなら、2行目、3行目を数値として扱った下のような表形式にするのがよさそう。データベースの操作のアクションもあるけど、ここではExcelを使用。

イメージ図


文字列のアクションの中で「分割」を使用すると、指定した区切り文字によって文字列からリストへ変換することができた。改行を区切りとして指定して1文ずつのリストとする。if、else文を使って、1文ずつ次のように処理を変える。
 1行目 商品名(Name):そのまま登録(A列)
 2行目 カロリー(Cal):数値だけ登録(B列) → kcalより前の部分を登録
 3行目 価格(Price):数値だけ登録(C列) → 円より前の部分を登録
 4行目 発売日(Sale):発売日を除き登録(D列) → 発売日を削除して登録
 5行目 備考(Note):元の文をまとめて登録(E列)
 空の行 Excel中、A列に戻し次の行に移動。

ある程度イメージはできたので、次回ロジックを組んでみよう。