IT塾

自分の備忘録を兼ねて。勉強したことを書いていくよ〜

紹介する内容について【WEBスクレイピング】

Pythonで仕事をしたいと思ったら、最初に候補に上がるといっても過言ではないWEBスクレイピング

 

今回、私が勉強している本について紹介します。

 

【参考書籍】

Amazon

 

もうすぐ第二版が出るようです。両方貼っときます。

 

楽天

 

WEBスクレイピング とは【WEBスクレイピング】

スクレイピングとはインターネット上に散らばる有益な情報を、必要な情報のみ抽出すること。

 

クローリングとは、さまざまなページを横断的に移動すること。

 

クローラー、ボット

・・・クローリングやスクレイピングで情報を収集するプログラム

 

Selenium

・・・ブラウザによる操作を自動化するツール

WEBアプリケーションのテストやスクレイピングに使用されている。

 

【参考文献】

 

クラス とは

 

クラスとは、オブジェクトのうち、共通する性質を持つものをまとめて名前をつけたもの。

 

クラスはオブジェクトを抽象化したもので、雛形(テンプレート)として存在するものと理解すればよい。

 

クラスに対して、クラスから生成された具体的な値を持つオブジェクトをインスタンスという。

シンタックスハイライト

 

Pythonや勉強は 関係ありませんが、はてブロはソースコード部分の文字色を変更できるシンタックスハイライトが使用できるみたいです。

はてな記法というみたいです。

 

help.hatenablog.com

 

一回使ってみようっと。はてな初心者でもできるかな?↓これ見本

>|ruby|
class Foo
  def bar'baz' # return baz
  end
end
||<

>|ruby| class Foo def bar'baz' # return baz end end ||<

 

>|python|<

for n in range(1,11) print(n, "", end="") ||<

 

 

|python|

>|python| for n in range(1,11)     print(n, "", end="") ||<

 

 

使えへんやん!むずかしい〜w

Python関数 辞書【Python】

 

 

【f】

from モジュール名 import *  (①p111)

・・・関数前のモジュール名を書かずに済ませる方法。

importとの違いは、モジュールの全体を利用するのがimportで、 モジュールの一部(変数や関数だと思ってください。)を利用するのがfrom。

(例) from turtle import *

 →文中でshape("turtle")と省略できる。

qiita.com

 

 

 

【r】

range関数(②p007.穴埋め式クイズ)

・・・整数の並びを生成するrangeオブジェクトを作成する。

 Pythonの組み込み関数の一つ。

 

【な】

内包(ないほう)表記(日経ソフトウェア 2021年付録)

・・・「リスト」や「辞書」など、「繰り返し可能オブジェクト」のループ処理を、簡潔に記述するための記法。

 

 

【も】

モジュール  (①p106)

・・・ある仕事を行う命令を別ファイルに分けて使うようにしたもの。

・・・importで読み込むファイル

(例)

import モジュール名 (import する)

モジュール名.関数名 (importしたモジュールの関数を使用する)

 

 

【参考書籍】

 

紹介する内容について【Python】

さて、Pythonについて勉強していこうと思うのですが、

 

私が紹介する内容は、以下の本で勉強した内容になっています。

 

  • Python1年生 第2版 体験してわかる!会話で学べる!プログラミングのしくみ

Amazon

Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ

 

楽天

 

楽天

 

Amazon

楽天

 

 

 

都度都度、どの本のどこに書いているかを書いていけたらと思います!

機械学習とは?【Python】

機械学習とは

機械学習とは、人間が知識を教えるのではなく、コンピュータにたくさんのデータを与えてコンピュータ自身が学習する方法です。

 

コンピュータが学習する方法は、3つあります。

 

教師あり学習

「問題」と「答え」のペアを大量に与えて、特徴を学習させる方法

コンピュータが問題と答えのデータ(教師データ)のペアを大量に見て、特徴を学習することで、「どのような問題は、どのような答えか」を把握できるようになる。

 

そのため、新しいデータを与えた時、その特徴からそれが何なのかを答えることができる。

文字認識・音声認識・翻訳 などで使われる。

 

教師データ・・・問題に対する答えのデータのこと。(教師代わりのデータという意味)

 

 

教師なし学習

答えのない大量のデータを調べ、グループ分け(クラスタリング)をさせる方法

(答えをみつけるための学習ではない)

コンピュータにたくさんのデータから似たモノ同士を見つけて、グループ分けをさせる。

 

強化学習

コンピュータにいろいろ移行錯誤させて、良い結果が出た時に「報酬」を与えて強化していく方法

 →「問題と答えのペアは教えないが、よい答えを思い出させるための学習」

 

【参考書籍】

Lesson23 より

Amazon

楽天