Javascript 遍历 DOM
DOM 让我们可以对元素和它们中的内容做任何事,但是首先我们需要获取到对应的 DOM 对象。
对 DOM 的所有操作都是以 document
对象开始。它是 DOM 的主“入口点”。从它我们可以访问任何节点。
这里是一张描述对象间链接的图片,通过这些链接我们可以在 DOM 节点之间移动。
让我们更详细地讨论它们吧。
在最顶层:documentElement 和 body
最顶层的树节点可以直接作为 document
的属性来使用:
<html>
= document.documentElement
最顶层的 document 节点是 document.documentElement
。这是对应 <html>
标签的 DOM 节点。
<body>
= document.body
另一个被广泛使用的 DOM 节点是 <body>
元素 —— document.body
。
<head>
= document.head
<head>
标签可以通过 document.head
访问。
这里有个问题:document.body 的值可能是 null
脚本无法访问在运行时不存在的元素。
尤其是,如果一个脚本是在
<head>
中,那么脚本是访问不到document.body
元素的,因为浏览器还没有读到它。
所以,下面例子中的第一个
alert
显示null
:
<html> <head> <script> alert( "From HEAD: " + document.body ); // null,这里目前还没有 <body> </script> </head> <body> <script> alert( "From BODY: " + document.body ); // HTMLBodyElement,现在存在了 </script> </body> </html>
在 DOM 的世界中,
null
就意味着“不存在”在 DOM 中,
null
值就意味着“不存在”或者“没有这个节点”。
子节点:childNodes,firstChild,lastChild
从现在开始,我们将使用下面这两个术语:
- 子节点(或者叫作子) —— 对应的是直系的子元素。换句话说,它们被完全嵌套在给定的元素中。例如,
<head>
和 <body>
就是 <html>
元素的子元素。 - 子孙元素 —— 嵌套在给定元素中的所有元素,包括子元素,以及子元素的子元素等。
例如,这里 <body>
有子元素 <div>
和 <ul>
(以及一些空白的文本节点):
<html>
<body>
<div>Begin</div>
<ul>
<li>
<b>Information</b>
</li>
</ul>
</body>
</html>
……<body>
元素的子孙元素不仅包含直接的子元素 <div>
和 <ul>
,还包含像 <li>
(<ul>
的子元素)和 <b>
(<li>
的子元素)这样的元素
— 整个子树。
childNodes
集合列出了所有子节点,包括文本节点。
下面这个例子显示了 document.body
的子元素:
<html>
<body>
<div>Begin</div>
<ul>
<li>Information</li>
</ul>
<div>End</div>
<script>
for (let i = 0; i < document.body.childNodes.length; i++) {
alert( document.body.childNodes[i] ); // Text, DIV, Text, UL, ..., SCRIPT
}
</script>
...more stuff...
</body>
</html>
请注意这里的一个有趣的细节。如果我们运行上面这个例子,所显示的最后一个元素是 <script>
。实际上,文档下面还有很多东西,但是在这个脚本运行的时候,浏览器还没有读到下面的内容,所以这个脚本也就看不到它们。
firstChild
和 lastChild
属性是访问第一个和最后一个子元素的快捷方式。
它们只是简写。如果元素存在子节点,那么下面的脚本运行结果将是 true:
elem.childNodes[0] === elem.firstChild
elem.childNodes[elem.childNodes.length - 1] === elem.lastChild
这里还有一个特别的函数 elem.hasChildNodes()
用于检查节点是否有子节点。
DOM 集合
正如我们看到的那样,childNodes
看起来就像一个数组。但实际上它并不是一个数组,而是一个 集合 —— 一个类数组的可迭代对象。
这个性质会导致两个重要的结果:
- 我们可以使用
for..of
来迭代它: - 无法使用数组的方法,因为它不是一个数组:
for (let node of document.body.childNodes) {
alert(node); // 显示集合中的所有节点
}
这是因为集合是可迭代的(提供了所需要的 Symbol.iterator
属性)。
alert(document.body.childNodes.filter); // undefined(这里没有 filter 方法!)
集合的性质所得到的第一个结果很不错。第二个结果也还可以忍受,因为如果我们想要使用数组的方法的话,我们可以使用 Array.from
方法来从集合创建一个“真”数组:
alert( Array.from(document.body.childNodes).filter ); // function
DOM 集合是只读的
DOM 集合,甚至可以说本章中列出的 所有 导航(navigation)属性都是只读的。
我们不能通过类似
childNodes[i] = ...
的操作来替换一个子节点。
修改子节点需要使用其它方法。我们将会在下一章中看到它们。
DOM 集合是实时的
除小部分例外,几乎所有的 DOM 集合都是 实时 的。换句话说,它们反映了 DOM 的当前状态。
如果我们保留一个对
elem.childNodes
的引用,然后向 DOM 中添加/移除节点,那么这些节点的更新会自动出现在集合中。
不要使用
for..in
来遍历集合可以使用
for..of
对集合进行迭代。但有时候人们会尝试使用for..in
来迭代集合。
请不要这么做。
for..in
循环遍历的是所有可枚举的(enumerable)属性。集合还有一些“额外的”很少被用到的属性,通常这些属性也是我们不期望得到的:
<body> <script> // 显示 0,1,length,item,values 及其他。 for (let prop in document.body.childNodes) alert(prop); </script> </body>
兄弟节点和父节点
兄弟节点(sibling) 是指有同一个父节点的节点。
例如,<head>
和 <body>
就是兄弟节点:
<html>
<head>...</head><body>...</body>
</html>
-
<body>
可以说是 <head>
的“下一个”或者“右边”兄弟节点。 -
<head>
可以说是 <body>
的“前一个”或者“左边”兄弟节点。
下一个兄弟节点在 nextSibling
属性中,上一个是在 previousSibling
属性中。
可以通过 parentNode
来访问父节点。
例如:
// <body> 的父节点是 <html>
alert( document.body.parentNode === document.documentElement ); // true
// <head> 的后一个是 <body>
alert( document.head.nextSibling ); // HTMLBodyElement
// <body> 的前一个是 <head>
alert( document.body.previousSibling ); // HTMLHeadElement
纯元素导航
上面列出的导航(navigation)属性引用 所有 节点。例如,在 childNodes
中我们可以看到文本节点,元素节点,甚至包括注释节点(如果它们存在的话)。
但是对于很多任务来说,我们并不想要文本节点或注释节点。我们希望操纵的是代表标签的和形成页面结构的元素节点。
所以,让我们看看更多只考虑 元素节点 的导航链接(navigation link):
这些链接和我们在上面提到过的类似,只是在词中间加了 Element
:
-
children
—— 仅那些作为元素节点的子代的节点。 -
firstElementChild
,lastElementChild
—— 第一个和最后一个子元素。 -
previousElementSibling
,nextElementSibling
—— 兄弟元素。 -
parentElement
—— 父元素。
为什么是
parentElement
? 父节点可以不是一个元素吗?
parentElement
属性返回的是“元素类型”的父节点,而parentNode
返回的是“任何类型”的父节点。这些属性通常来说是一样的:它们都是用于获取父节点。
唯一的例外就是
document.documentElement
:
alert( document.documentElement.parentNode ); // document alert( document.documentElement.parentElement ); // null
因为根节点
document.documentElement
(<html>
)的父节点是document
。但document
不是一个元素节点,所以parentNode
返回了document
,但parentElement
返回的是null
。
当我们想从任意节点
elem
到<html>
而不是到document
时,这个细节可能很有用:
while(elem = elem.parentElement) { // 向上,直到 <html> alert( elem ); }
让我们修改上面的一个示例:用 children
来替换 childNodes
。现在它只显示元素:
<html>
<body>
<div>Begin</div>
<ul>
<li>Information</li>
</ul>
<div>End</div>
<script>
for (let elem of document.body.children) {
alert(elem); // DIV, UL, DIV, SCRIPT
}
</script>
...
</body>
</html>
更多链接:表格
到现在,我们已经描述了基本的导航(navigation)属性。
方便起见,某些类型的 DOM 元素可能会提供特定于其类型的其他属性。
表格(Table)是一个很好的例子,它代表了一个特别重要的情况:
<table>
元素支持 (除了上面给出的,之外) 以下属性:
-
table.rows
—— <tr>
元素的集合。 -
table.caption/tHead/tFoot
—— 引用元素 <caption>
,<thead>
,<tfoot>
。 -
table.tBodies
—— <tbody>
元素的集合(根据标准还有很多元素,但是这里至少会有一个 —— 即使没有被写在 HTML 源文件中,浏览器也会将其放入 DOM 中)。
<thead>
,<tfoot>
,<tbody>
元素提供了 rows
属性:
-
tbody.rows
—— 表格内部 <tr>
元素的集合。
<tr>
:
-
tr.cells
—— 在给定 <tr>
中的 <td>
和 <th>
单元格的集合。 -
tr.sectionRowIndex
—— 给定的 <tr>
在封闭的 <thead>/<tbody>/<tfoot>
中的位置(索引)。 -
tr.rowIndex
—— 在整个表格中 <tr>
的编号(包括表格的所有行)。
<td>
和 <th>
:
-
td.cellIndex
—— 在封闭的 <tr>
中单元格的编号。
用法示例:
<table id="table">
<tr>
<td>one</td><td>two</td>
</tr>
<tr>
<td>three</td><td>four</td>
</tr>
</table>
<script>
// 获取带有 "two" 的 td(第一行,第二列)
let td = table.rows[0].cells[1];
td.style.backgroundColor = "red"; // highlight it
</script>
规范:tabular data。
HTML 表单(form)还有其它导航(navigation)属性。稍后当我们开始使用表单(form)时,我们将对其进行研究。
总结
给定一个 DOM 节点,我们可以使用导航(navigation)属性访问其直接的邻居。
这些属性主要分为两组:
- 对于所有节点:
parentNode
,childNodes
,firstChild
,lastChild
,previousSibling
,nextSibling
。 - 仅对于元素节点:
parentElement
,children
,firstElementChild
,lastElementChild
,previousElementSibling
,nextElementSibling
。
某些类型的 DOM 元素,例如 table,提供了用于访问其内容的其他属性和集合。
任务
DOM 子节点
对于这个页面:
<html>
<body>
<div>Users:</div>
<ul>
<li>John</li>
<li>Pete</li>
</ul>
</body>
</html>
对于以下各项,请给出至少一种访问方式:
-
<div>
DOM 节点? -
<ul>
DOM 节点? - 第二个
<li>
节点(即包含 Pete 的节点)?
解决方案
这里有很多种方法,例如:
获取 <div>
DOM 节点:
document.body.firstElementChild
// 或
document.body.children[0]
// 或(第一个节点是空格,所以我们应该获取的是第二个)
document.body.childNodes[1]
获取 <ul>
DOM 节点:
document.body.lastElementChild
// 或
document.body.children[1]
获取第二个 <li>
(即包含 Pete 的节点):
// 获取 <ul>,然后获取它的最后一个子元素
document.body.lastElementChild.lastElementChild
兄弟节点问题
重要程度: 5
如果 elem
是任意一个 DOM 元素节点……
-
elem.lastChild.nextSibling
值一直都是 null
,这个判定是不是真的? -
elem.children[0].previousSibling
值一直都是 null
,这个判定是不是真的?
解决方案
- 是的,这是真的。
elem.lastChild
就是最后一个节点,它没有 nextSibling
。 - 不,这是错的,因为
elem.children[0]
是元素中的第一个子元素。但是在它前面可能存在非元素的节点。所以 previousSibling
可能是一个文本节点。
请注意,对于这两种情况,如果没有子节点,那么就会报错。
如果这里没有子节点,那么 elem.lastChild
是 null
,所以我们就访问不到 elem.lastChild.nextSibling
。并且 elem.children
是空的(像一个空数组一样 []
)。
选择所有对角单元格
编写代码来把表格中的对角单元格都绘制成红色。
你需要用代码从 <table>
中获取所有的对角单元格 <td>
,然后绘制它们:
// td 表示的是对单元格的引用
td.style.backgroundColor = 'red';
结果应该如下所示:
解决方案
我们将使用 rows
和 cells
属性来获取表格中的对角单元格。
<!DOCTYPE HTML>
<html>
<head>
<style>
table {
border-collapse: collapse;
}
td {
border: 1px solid black;
padding: 3px 5px;
}
</style>
</head>
<body>
<table>
<tr>
<td>1:1</td>
<td>2:1</td>
<td>3:1</td>
<td>4:1</td>
<td>5:1</td>
</tr>
<tr>
<td>1:2</td>
<td>2:2</td>
<td>3:2</td>
<td>4:2</td>
<td>5:2</td>
</tr>
<tr>
<td>1:3</td>
<td>2:3</td>
<td>3:3</td>
<td>4:3</td>
<td>5:3</td>
</tr>
<tr>
<td>1:4</td>
<td>2:4</td>
<td>3:4</td>
<td>4:4</td>
<td>5:4</td>
</tr>
<tr>
<td>1:5</td>
<td>2:5</td>
<td>3:5</td>
<td>4:5</td>
<td>5:5</td>
</tr>
</table>
<script>
let table = document.body.firstElementChild;
for (let i = 0; i < table.rows.length; i++) {
let row = table.rows[i];
row.cells[i].style.backgroundColor = 'red';
}
</script>
</body>
</html>