R_rmarkdown:render()_20240906

Topic(Purpose / Outcome:目的・期待される成果)

Conductor
Conductor

rmarkdown:render()の読込まで(生データの作成は別の機会で)

Visualization(How / Output:事実整理 / 最終ゴール)

Visualizer
Visualizer

PDFを指定してアウトプット

Script Design / Summary(How:設計図・概要・論理構築)

Wrangler
Wrangler

全体像はこんな感じ

# 1.0 LIBRARIES ----

library(rmarkdown)

# 2.0 AUTOMATE PDF REPORTING ----
# - Make sure you have tinytex installed with: tinytex::install_tinytex()

install.packages("tinytex")
library(tinytex)

# Technology Portfolio ----
portfolio_name <- "Technology Portfolio"
symbols        <- c("AAPL", "GOOG", "NFLX", "NVDA")
output_file    <- "technology_portfolio.pdf"

# Financial Portfolio ----
portfolio_name <- "Financial Portfolio"
symbols        <- c("V", "MA", "PYPL")
output_file    <- "financial_portfolio.pdf"

# Automation Code ----
rmarkdown::render(
    # render() 関数は、R Markdown ファイルをレンダリングします。
    # render(input, output_format, output_file, output_dir, params)
    input         = "007_pdf_reporting/template/stock_report_template.Rmd",
    # input: レンダリングするR Markdownファイルのパス
    # レンダリングとは、R MarkdownファイルをHTML、PDF、Wordなどのファイル形式に変換することです。
    # 前提として、R Markdownファイルは、事前に作成する必要性がある。
    output_format = "pdf_document",
    # output_format: レンダリングするファイル形式を指定します。
    output_file   = output_file,
    # output_file: レンダリングされたファイルの名前を指定します。
    # ここでは変数output_fileに格納されたファイル名を指定しています。
    output_dir    = "007_pdf_reporting/output/",
    # output_dir: レンダリングされたファイルの保存先ディレクトリを指定します。
    # params: レンダリング時に使用するパラメータを指定します。
    # list 関数を使用して、portfolio_name、symbols、start、end、show_codeのパラメータを指定しています。
    params        = list(
        portfolio_name = portfolio_name,
        # portfolio_name: ポートフォリオ名を指定します。
        symbols        = symbols,
        # symbols: シンボルを指定します。
        start          = "2010-01-01",
        # start: 開始日を指定します。
        end            = "2019-12-31",
        # end: 終了日を指定します。
        show_code      = FALSE
        # show_code: コードを表示するかどうかを指定します。
    )
)

Raw data / Wrangling / Feature Engineering(抽出~整形)

Raw data(How:生データ抽出元)

  • Source: Yahoo finance

Raw data(How:生データ抽出方法)

  • SQL読込: –
  • CSV読込: –
  • API読込 : 〇
  • rmarkdown:render()読込:- (.rmdのファイルをtemlate保存しておく必要あり)

Raw data(How:生データの構造 / 種類)

Extractor
Extractor

元々のデータフレーム(.rmdファイルを作成する必要がある)

Wrangling (How: Loading・生データ読込)

Wrangler
Wrangler

Loading

# Script on Rstudio
# Tips: 読み込み先のファイルは「記載するpath名の始まり」からWorking Directoryとして設定する必要性がある。


# Automation Code ----
rmarkdown::render(
    # render() 関数は、R Markdown ファイルをレンダリングします。
    # render(input, output_format, output_file, output_dir, params)
    input         = "007_pdf_reporting/template/stock_report_template.Rmd",
    # input: レンダリングするR Markdownファイルのパス
    # レンダリングとは、R MarkdownファイルをHTML、PDF、Wordなどのファイル形式に変換することです。
    # 前提として、R Markdownファイルは、事前に作成する必要性がある。
    output_format = "pdf_document",
    # output_format: レンダリングするファイル形式を指定します。
    output_file   = output_file,
    # output_file: レンダリングされたファイルの名前を指定します。
    # ここでは変数output_fileに格納されたファイル名を指定しています。
    output_dir    = "007_pdf_reporting/output/",
    # output_dir: レンダリングされたファイルの保存先ディレクトリを指定します。
    # params: レンダリング時に使用するパラメータを指定します。
    # list 関数を使用して、portfolio_name、symbols、start、end、show_codeのパラメータを指定しています。
    params        = list(
        portfolio_name = portfolio_name,
        # portfolio_name: ポートフォリオ名を指定します。
        symbols        = symbols,
        # symbols: シンボルを指定します。
        start          = "2010-01-01",
        # start: 開始日を指定します。
        end            = "2019-12-31",
        # end: 終了日を指定します。
        show_code      = FALSE
        # show_code: コードを表示するかどうかを指定します。
    )
)

Wrangling (How: before output、Output前のデータ構造)

Wrangler
Wrangler

視える化に合わせて編集

特になし。

メモ

  • 行 (row) :レコード、Observation
  • 列 (column):特徴量、変数、次元数、次元の削減(Dimensionality Reduction): 高次元データを少ない次元に圧縮し、モデルの効率を上げるための手法。
  • 値:data point、Feature
  • Wide format:クロス集計表(横持ちデータ)、Long format:縦持ちデータ
  • 情報ソースがWEBサイト(HTMLやCSS)の場合にはどこから抽出するか、が問われるので、HTMLやCSSの知識が必要(スクレイピングを実施するにせよ)。
  • レンダリング(rendering)とはコンピュータがデータを処理して画像や映像、テキストなどを表示させる技術。

参考リンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA