Conductor
rmarkdown:render()の読込まで(生データの作成は別の機会で)
Visualizer
PDFを指定してアウトプット
Wrangler
全体像はこんな感じ
# 1.0 LIBRARIES ----
library(rmarkdown)
# 2.0 AUTOMATE PDF REPORTING ----
# - Make sure you have tinytex installed with: tinytex::install_tinytex()
install.packages("tinytex")
library(tinytex)
# Technology Portfolio ----
portfolio_name <- "Technology Portfolio"
symbols <- c("AAPL", "GOOG", "NFLX", "NVDA")
output_file <- "technology_portfolio.pdf"
# Financial Portfolio ----
portfolio_name <- "Financial Portfolio"
symbols <- c("V", "MA", "PYPL")
output_file <- "financial_portfolio.pdf"
# Automation Code ----
rmarkdown::render(
# render() 関数は、R Markdown ファイルをレンダリングします。
# render(input, output_format, output_file, output_dir, params)
input = "007_pdf_reporting/template/stock_report_template.Rmd",
# input: レンダリングするR Markdownファイルのパス
# レンダリングとは、R MarkdownファイルをHTML、PDF、Wordなどのファイル形式に変換することです。
# 前提として、R Markdownファイルは、事前に作成する必要性がある。
output_format = "pdf_document",
# output_format: レンダリングするファイル形式を指定します。
output_file = output_file,
# output_file: レンダリングされたファイルの名前を指定します。
# ここでは変数output_fileに格納されたファイル名を指定しています。
output_dir = "007_pdf_reporting/output/",
# output_dir: レンダリングされたファイルの保存先ディレクトリを指定します。
# params: レンダリング時に使用するパラメータを指定します。
# list 関数を使用して、portfolio_name、symbols、start、end、show_codeのパラメータを指定しています。
params = list(
portfolio_name = portfolio_name,
# portfolio_name: ポートフォリオ名を指定します。
symbols = symbols,
# symbols: シンボルを指定します。
start = "2010-01-01",
# start: 開始日を指定します。
end = "2019-12-31",
# end: 終了日を指定します。
show_code = FALSE
# show_code: コードを表示するかどうかを指定します。
)
)
Raw data / Wrangling / Feature Engineering(抽出~整形)
- Source: Yahoo finance
- SQL読込: –
- CSV読込: –
- API読込 : 〇
- rmarkdown:render()読込:- (.rmdのファイルをtemlate保存しておく必要あり)
Extractor
元々のデータフレーム(.rmdファイルを作成する必要がある)
Wrangler
Loading
# Script on Rstudio
# Tips: 読み込み先のファイルは「記載するpath名の始まり」からWorking Directoryとして設定する必要性がある。
# Automation Code ----
rmarkdown::render(
# render() 関数は、R Markdown ファイルをレンダリングします。
# render(input, output_format, output_file, output_dir, params)
input = "007_pdf_reporting/template/stock_report_template.Rmd",
# input: レンダリングするR Markdownファイルのパス
# レンダリングとは、R MarkdownファイルをHTML、PDF、Wordなどのファイル形式に変換することです。
# 前提として、R Markdownファイルは、事前に作成する必要性がある。
output_format = "pdf_document",
# output_format: レンダリングするファイル形式を指定します。
output_file = output_file,
# output_file: レンダリングされたファイルの名前を指定します。
# ここでは変数output_fileに格納されたファイル名を指定しています。
output_dir = "007_pdf_reporting/output/",
# output_dir: レンダリングされたファイルの保存先ディレクトリを指定します。
# params: レンダリング時に使用するパラメータを指定します。
# list 関数を使用して、portfolio_name、symbols、start、end、show_codeのパラメータを指定しています。
params = list(
portfolio_name = portfolio_name,
# portfolio_name: ポートフォリオ名を指定します。
symbols = symbols,
# symbols: シンボルを指定します。
start = "2010-01-01",
# start: 開始日を指定します。
end = "2019-12-31",
# end: 終了日を指定します。
show_code = FALSE
# show_code: コードを表示するかどうかを指定します。
)
)
Wrangler
視える化に合わせて編集
特になし。
メモ
- 行 (row) :レコード、Observation
- 列 (column):特徴量、変数、次元数、次元の削減(Dimensionality Reduction): 高次元データを少ない次元に圧縮し、モデルの効率を上げるための手法。
- 値:data point、Feature
- Wide format:クロス集計表(横持ちデータ)、Long format:縦持ちデータ
- 情報ソースがWEBサイト(HTMLやCSS)の場合にはどこから抽出するか、が問われるので、HTMLやCSSの知識が必要(スクレイピングを実施するにせよ)。
- レンダリング(rendering)とはコンピュータがデータを処理して画像や映像、テキストなどを表示させる技術。
参考リンク
- Script事例:https://www.business-science.io/
- Rデータの種類:https://ebreha.com/__trashed/