HTML DOM 筆記

有了 pythonwebkit 後, 可以用 python 直接存取 DOM。於是得自己學一下 DOM 的操作方式, 不能再依賴 jQuery 啦。

花個半小時邊看邊操作 《HTML DOM Tutorial》, 很快就有個基本概念了。記一下自己不熟的部份:

  • DOM 的 node 類型有: document, element, text, attribute, comment
  • element node 沒有包含文字, 要從它的 text node 拿:
    • document.getElementsByTagName('p')[0].nodeValue # null
    • document.getElementsByTagName('p')[0].firstChild.nodeValue # the expected texts
  • 操作 iframe 的內容
    • 取得 iframe 的 DOM: d = document.getElementsByTagName('iframe')[0].contentDocument
    • 接著就能用一樣的 DOM API 操作 d
    • 我只有在 Chrome 下試, 畢竟 pythonwebkit 的功能應該和 Chrome 差不多才對。要跨瀏覽器操作 DOM 的話, 得多試幾種變數, 取出 iframe 的 DOM

留言

這個網誌中的熱門文章

(C/C++ ) 如何在 Linux 上使用自行編譯的第三方函式庫

熟悉系統工具好處多多

virtualbox 使用 USB 裝置