洞察與分析
洞察與分析為 Docker Hub 上的 Docker 驗證釋出者 (DVP) 和 Docker 贊助開源專案 (DSOS) 映象提供使用情況分析。這包括在指定時間範圍內對映象和擴充套件使用情況指標的自助訪問。您還可以按 Tag 或按 digest 顯示映象拉取次數,並按地理位置、雲提供商、客戶端等獲取詳細分類資料。
提示
前往 Docker 驗證釋出者計劃 或 Docker 贊助開源專案 頁面,瞭解更多關於這些計劃的資訊。
檢視映象的分析資料
您可以在以下 URL 的洞察與分析儀表盤上找到您倉庫的分析資料:https://hub.docker.com/orgs/{namespace}/insights/images
。該儀表盤包含使用資料的視覺化圖表以及一個可下載 CSV 檔案的資料表格。
在圖表中檢視資料
- 選擇資料粒度:每週或每月
- 選擇時間間隔:3、6 或 12 個月
- 在列表中選擇一個或多個倉庫


提示
將游標懸停在圖表上會顯示一個工具提示,顯示特定時間點上的精確資料。
分享分析資料
您可以使用圖表上方的分享圖示與其他人分享視覺化圖表。這是與組織內其他人分享統計資料的便捷方式。


選擇該圖示會生成一個連結,並複製到您的剪貼簿。該連結會保留您所做的顯示選擇。當有人透過該連結訪問時,會開啟洞察與分析頁面,並按照您建立連結時的設定顯示圖表。
擴充套件分析資料
如果您在擴充套件 Marketplace 中釋出了 Docker 擴充套件,您還可以獲取有關擴充套件使用情況的分析資料,這些資料可作為 CSV 檔案下載。您可以從以下 URL 的洞察與分析儀表盤下載擴充套件 CSV 報告:https://hub.docker.com/orgs/{namespace}/insights/extensions
。如果您的 Docker namespace 包含 Marketplace 中已知的擴充套件,您將看到一個擴充套件選項卡,其中列出了您的擴充套件的 CSV 檔案。
匯出分析資料
您可以從 Web 儀表盤或使用 DVP Data API 匯出分析資料。組織的所有成員都可以訪問分析資料。
資料可作為可下載的 CSV 檔案提供,格式為每週(週一至週日)或每月。月度資料從下一個日曆月的第一天開始可用。您可以將此資料匯入到您自己的系統中,也可以手動作為電子表格進行分析。
匯出資料
按照以下步驟使用 Docker Hub 網站匯出您組織映象的使用資料
登入到 Docker Hub 並選擇我的 Hub。
選擇您的組織,然後選擇分析。
設定要匯出分析資料的時間範圍。
彙總資料和原始資料的可下載 CSV 檔案會出現在右側。
使用 API 匯出資料
HTTP API 端點位於:https://hub.docker.com/api/publisher/analytics/v1
。在DVP Data API 文件中瞭解如何使用 API 匯出資料。
資料點
可以匯出原始格式或彙總格式的資料。每種格式包含不同的資料點和不同的結構。
以下部分描述了每種格式可用的資料點。新增日期列顯示該欄位首次引入的時間。
映象拉取原始資料
原始資料格式包含以下資料點。CSV 檔案中的每一行代表一次映象拉取。
資料點 | 描述 | 新增日期 |
---|---|---|
操作 | 請求型別,參見操作分類規則。之一:pull_by_tag , pull_by_digest , version_check 。 | 2022 年 1 月 1 日 |
操作日 | 時間戳的日期部分:YYYY-MM-DD 。 | 2022 年 1 月 1 日 |
國家/地區 | 請求源國家/地區。 | 2022 年 1 月 1 日 |
Digest | 映象 digest。 | 2022 年 1 月 1 日 |
HTTP 方法 | 請求中使用的 HTTP 方法,詳情參見Registry API 文件。 | 2022 年 1 月 1 日 |
雲服務提供商 | 事件中使用的雲服務提供商。 | 2022 年 1 月 1 日 |
Namespace | Docker 組織(映象 namespace)。 | 2022 年 1 月 1 日 |
參考 | 請求中使用的映象 digest 或 Tag。 | 2022 年 1 月 1 日 |
倉庫 | Docker 倉庫(映象名稱)。 | 2022 年 1 月 1 日 |
Tag(可用時包含) | 僅當請求引用 Tag 時可用的 Tag 名稱。 | 2022 年 1 月 1 日 |
時間戳 | 請求的日期和時間:YYYY-MM-DD 00:00:00 。 | 2022 年 1 月 1 日 |
型別 | 事件源自的行業。之一:business (企業), isp (網際網路服務提供商), hosting (託管), null (空)。 | 2022 年 1 月 1 日 |
使用者代理工具 | 使用者用於拉取映象的應用(例如,docker 或 containerd )。 | 2022 年 1 月 1 日 |
使用者代理版本 | 用於拉取映象的應用版本。 | 2022 年 1 月 1 日 |
域 | 請求源域,參見隱私。 | 2022 年 10 月 11 日 |
所有者 | 擁有該倉庫的組織的名稱。 | 2022 年 12 月 19 日 |
映象拉取彙總資料
彙總資料有兩種級別可用
- 倉庫級別:每個 namespace 和倉庫的彙總資料
- Tag 或 digest 級別:每個 namespace、倉庫和引用(Tag 或 digest)的彙總資料
彙總資料格式包含選定時間範圍內的以下資料點
資料點 | 描述 | 新增日期 |
---|---|---|
唯一 IP 地址 | 唯一 IP 地址數量,參見隱私。 | 2022 年 1 月 1 日 |
按 Tag 拉取 | GET 請求,按 digest 或按 Tag。 | 2022 年 1 月 1 日 |
按 Digest 拉取 | 按 digest 的 GET 或 HEAD 請求,或按 digest 的 HEAD 請求。 | 2022 年 1 月 1 日 |
版本檢查 | 按 Tag 的 HEAD 請求,後不跟 GET | 2022 年 1 月 1 日 |
所有者 | 擁有該倉庫的組織的名稱。 | 2022 年 12 月 19 日 |
映象拉取操作分類規則
一個操作代表與 docker pull
相關的多個請求事件。拉取按類別分組,以便更有效地理解使用者行為和意圖。類別包括
- 版本檢查
- 按 Tag 拉取
- 按 Digest 拉取
自動化系統會頻繁檢查您的映象的新版本。能夠區分 CI 中的“版本檢查”和使用者的實際映象拉取,可以幫助您更深入地瞭解使用者的行為。
下表描述了用於確定拉取意圖的規則。要提供反饋或就這些規則提問,請填寫 Google 表單。
起始事件 | 參考 | 後續事件 | 結果操作 | 用例 | 備註 |
---|---|---|---|---|---|
HEAD | tag | 不適用 | 版本檢查 | 使用者本地已存在所有層 | 這類似於使用者本地已存在所有映象層時按 Tag 拉取的情況,但它區分了使用者的意圖並據此進行分類。 |
GET | tag | 不適用 | 按 Tag 拉取 | 使用者本地已存在所有層和/或映象為單架構 | |
GET | tag | 按不同的 digest 獲取 | 按 Tag 拉取 | 映象為多架構 | 第二個按 digest 的 GET 請求必須與第一個不同。 |
HEAD | tag | 按相同的 digest 獲取 | 按 Tag 拉取 | 映象為多架構,但本地已存在部分或全部映象層 | 按 Tag 的 HEAD 請求傳送最新的 digest,後續的 GET 請求必須是該相同的 digest。如果映象為多架構(參見本表下一行),可能會出現額外的 GET 請求。如果使用者不想要最新的 digest,則會執行按 digest 的 HEAD 請求。 |
HEAD | tag | 按相同的 digest 獲取,然後按不同的 digest 進行第二次獲取 | 按 Tag 拉取 | 映象為多架構 | 按 Tag 的 HEAD 請求傳送最新的 digest,後續的 GET 請求必須是該相同的 digest。因為映象為多架構,所以會有第二個按不同 digest 的 GET 請求。如果使用者不想要最新的 digest,則會執行按 digest 的 HEAD 請求。 |
HEAD | tag | 按相同的 digest 獲取,然後按不同的 digest 進行第二次獲取 | 按 Tag 拉取 | 映象為多架構 | 按 Tag 的 HEAD 請求傳送最新的 digest,後續的 GET 請求必須是該相同的 digest。因為映象為多架構,所以會有第二個按不同 digest 的 GET 請求。如果使用者不想要最新的 digest,則會執行按 digest 的 HEAD 請求。 |
GET | digest | 不適用 | 按 Digest 拉取 | 使用者本地已存在所有層和/或映象為單架構 | |
HEAD | digest | 不適用 | 按 Digest 拉取 | 使用者本地已存在所有層 | |
GET | digest | 按不同的 digest 獲取 | 按 Digest 拉取 | 映象為多架構 | 第二個按 digest 的 GET 請求必須與第一個不同。 |
HEAD | digest | 按相同的 digest 獲取 | 按 Digest 拉取 | 映象為單架構和/或映象為多架構但本地已存在部分映象 | |
HEAD | digest | 按相同的 digest 獲取,然後按不同的 digest 進行第二次獲取 | 按 Digest 拉取 | 映象為多架構 |
擴充套件彙總資料
擴充套件彙總資料有兩種級別可用
- 核心彙總:包含基本的擴充套件使用資訊:擴充套件安裝次數、解除安裝次數和總安裝次數
core-summary-data 檔案包含選定時間範圍內的以下資料點
資料點 | 描述 | 新增日期 |
---|---|---|
安裝次數 | 擴充套件的安裝次數 | 2024 年 2 月 1 日 |
總安裝次數 | 擴充套件的總安裝次數 | 2024 年 2 月 1 日 |
解除安裝次數 | 擴充套件的解除安裝次數 | 2024 年 2 月 1 日 |
總解除安裝次數 | 擴充套件的總解除安裝次數 | 2024 年 2 月 1 日 |
更新次數 | 擴充套件的更新次數 | 2024 年 2 月 1 日 |
- 高階彙總:包含高階的擴充套件使用資訊:唯一使用者的安裝次數、解除安裝次數,唯一使用者的擴充套件開啟次數。
core-summary-data 檔案包含選定時間範圍內的以下資料點
資料點 | 描述 | 新增日期 |
---|---|---|
安裝次數 | 擴充套件的安裝次數 | 2024 年 2 月 1 日 |
唯一安裝使用者數 | 安裝擴充套件的唯一使用者數量 | 2024 年 2 月 1 日 |
解除安裝次數 | 擴充套件的解除安裝次數 | 2024 年 2 月 1 日 |
唯一解除安裝使用者數 | 解除安裝擴充套件的唯一使用者數量 | 2024 年 2 月 1 日 |
用法 | 擴充套件選項卡的開啟次數 | 2024 年 2 月 1 日 |
唯一使用者數 | 開啟擴充套件選項卡的唯一使用者數量 | 2024 年 2 月 1 日 |
資料隨時間的變化
洞察與分析服務持續改進,以增加其對釋出者的價值。一些更改可能包括新增新的資料點,或改進現有資料使其更實用。
資料集中的更改(例如新增或刪除欄位)通常僅從該欄位首次引入的日期開始生效。
請參閱資料點部分中的表格,檢視特定資料點從哪個日期開始可用。
隱私
本節包含關於隱私保護措施的資訊,這些措施確保 Docker Hub 上的內容消費者完全匿名。
重要提示
Docker 絕不會在分析資料中分享任何個人身份資訊 (PII)。
映象拉取彙總資料集包含唯一 IP 地址計數。此資料點僅包含請求映象的不同唯一 IP 地址的數量。絕不會分享單獨的 IP 地址。
映象拉取原始資料集包含使用者 IP 域作為一個數據點。這是與用於拉取映象的 IP 地址關聯的域名。如果 IP 型別是 business
(企業),則該域表示與該 IP 地址關聯的公司或組織(例如,docker.com
)。對於任何其他非 business
(企業)的 IP 型別,該域表示用於發出請求的網際網路服務提供商或託管提供商。平均而言,只有約 30% 的拉取被歸類為 business
(企業)IP 型別(這因釋出者和映象而異)。