執行容器
Docker 在隔離容器中執行程序。容器是在主機上執行的程序。主機可以是本地的,也可以是遠端的。當您執行 docker run
時,執行的容器程序是隔離的,它擁有自己的檔案系統、自己的網路以及與主機分開的獨立程序樹。
本頁詳細介紹瞭如何使用 docker run
命令執行容器。
通用格式
一個 docker run
命令具有以下形式:
$ docker run [OPTIONS] IMAGE[:TAG|@DIGEST] [COMMAND] [ARG...]
docker run
命令必須指定一個映象引用來建立容器。
映象引用
映象引用是映象的名稱和版本。您可以使用映象引用基於映象建立或執行容器。
docker run IMAGE[:TAG][@DIGEST]
docker create IMAGE[:TAG][@DIGEST]
映象標籤是映象版本,省略時預設為 latest
。使用標籤可以從特定版本的映象執行容器。例如,要執行 ubuntu
映象的 24.04
版本:docker run ubuntu:24.04
。
映象摘要
使用 v2 或更高版本映象格式的映象具有一個內容可定址的識別符號,稱為摘要 (digest)。只要用於生成映象的輸入保持不變,摘要值就是可預測的。
以下示例使用 alpine
映象和 sha256:9cacb71397b640eca97488cf08582ae4e4068513101088e9f96c9814bfda95e0
摘要執行容器:
$ docker run alpine@sha256:9cacb71397b640eca97488cf08582ae4e4068513101088e9f96c9814bfda95e0 date
選項
[OPTIONS]
允許您配置容器的選項。例如,您可以給容器指定名稱 (--name
),或將其作為後臺程序執行 (-d
)。您還可以設定選項來控制資源限制和網路等方面。
命令和引數
您可以使用 [COMMAND]
和 [ARG...]
位置引數來指定容器啟動時要執行的命令和引數。例如,您可以指定 sh
作為 [COMMAND]
,結合 -i
和 -t
標誌,在容器中啟動一個互動式 shell(如果您選擇的映象在 PATH
上有 sh
可執行檔案)。
$ docker run -it IMAGE sh
注意
根據您的 Docker 系統配置,您可能需要在
docker run
命令前加上sudo
。為了避免在使用docker
命令時需要使用sudo
,您的系統管理員可以建立一個名為docker
的 Unix 組並將使用者新增到其中。有關此配置的更多資訊,請參閱您的作業系統的 Docker 安裝文件。
前臺和後臺
啟動容器時,容器預設在前臺執行。如果您想讓容器在後臺執行,可以使用 --detach
(或 -d
)標誌。這將啟動容器而不佔用您的終端視窗。
$ docker run -d <IMAGE>
當容器在後臺執行時,您可以使用其他 CLI 命令與容器互動。例如,docker logs
允許您檢視容器日誌,而 docker attach
則將其帶到前臺。
$ docker run -d nginx
0246aa4d1448a401cabd2ce8f242192b6e7af721527e48a810463366c7ff54f1
$ docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
0246aa4d1448 nginx "/docker-entrypoint.…" 2 seconds ago Up 1 second 80/tcp pedantic_liskov
$ docker logs -n 5 0246aa4d1448
2023/11/06 15:58:23 [notice] 1#1: start worker process 33
2023/11/06 15:58:23 [notice] 1#1: start worker process 34
2023/11/06 15:58:23 [notice] 1#1: start worker process 35
2023/11/06 15:58:23 [notice] 1#1: start worker process 36
2023/11/06 15:58:23 [notice] 1#1: start worker process 37
$ docker attach 0246aa4d1448
^C
2023/11/06 15:58:40 [notice] 1#1: signal 2 (SIGINT) received, exiting
...
有關與前臺和後臺模式相關的 docker run
標誌的更多資訊,請參閱:
docker run --detach
:在後臺執行容器docker run --attach
:連線到stdin
、stdout
和stderr
docker run --tty
:分配一個偽 ttydocker run --interactive
:即使未連線也保持stdin
開啟
有關重新連線到後臺容器的更多資訊,請參閱 docker attach
。
容器標識
您可以透過三種方式標識容器:
識別符號型別 | 示例值 |
---|---|
UUID 長識別符號 | f78375b1c487e03c9438c729345e54db9d20cfa2ac1fc3494b6eb60872e74778 |
UUID 短識別符號 | f78375b1c487 |
名稱 | evil_ptolemy |
UUID 識別符號是由守護程序分配給容器的隨機 ID。
守護程序會自動為容器生成一個隨機字串名稱。您也可以使用 --name
標誌定義自定義名稱。定義一個 name
可以方便地為容器新增意義。如果您指定了 name
,則可以在使用者定義網路中引用該容器時使用它。這適用於後臺和前臺 Docker 容器。
容器識別符號與映象引用不同。映象引用指定了執行容器時使用的映象是哪個。您不能執行 docker exec nginx:alpine sh
在基於 nginx:alpine
映象的容器中開啟 shell,因為 docker exec
需要容器識別符號(名稱或 ID),而不是映象。
雖然容器使用的映象不是容器的識別符號,但您可以透過使用 `--filter` 標誌找到使用特定映象的容器 ID。例如,以下 docker ps
命令獲取基於 nginx:alpine
映象的所有正在執行的容器的 ID:
$ docker ps -q --filter ancestor=nginx:alpine
有關使用過濾器的更多資訊,請參閱過濾。
容器網路
容器預設啟用網路,並且可以進行出站連線。如果您執行多個需要相互通訊的容器,您可以建立一個自定義網路並將這些容器連線到該網路。
當多個容器連線到同一個自定義網路時,它們可以使用容器名稱作為 DNS 主機名相互通訊。以下示例建立了一個名為 my-net
的自定義網路,並執行兩個連線到該網路的容器。
$ docker network create my-net
$ docker run -d --name web --network my-net nginx:alpine
$ docker run --rm -it --network my-net busybox
/ # ping web
PING web (172.18.0.2): 56 data bytes
64 bytes from 172.18.0.2: seq=0 ttl=64 time=0.326 ms
64 bytes from 172.18.0.2: seq=1 ttl=64 time=0.257 ms
64 bytes from 172.18.0.2: seq=2 ttl=64 time=0.281 ms
^C
--- web ping statistics ---
3 packets transmitted, 3 packets received, 0% packet loss
round-trip min/avg/max = 0.257/0.288/0.326 ms
有關容器網路的更多資訊,請參閱網路概述
檔案系統掛載
預設情況下,容器中的資料儲存在一個臨時的、可寫的容器層中。移除容器也會移除其資料。如果您想將持久化資料與容器一起使用,可以使用檔案系統掛載將資料持久儲存在主機系統上。檔案系統掛載還可以讓您在容器和主機之間共享資料。
Docker 支援兩類主要的掛載:
- 卷掛載
- 繫結掛載
卷掛載非常適合為容器持久儲存資料以及在容器之間共享資料。另一方面,繫結掛載用於在容器和主機之間共享資料。
您可以使用 docker run
命令的 --mount
標誌為容器新增檔案系統掛載。
以下部分展示瞭如何建立卷和繫結掛載的基本示例。有關更深入的示例和描述,請參閱文件中的儲存部分。
卷掛載
建立卷掛載:
$ docker run --mount source=<VOLUME_NAME>,target=[PATH] [IMAGE] [COMMAND...]
在這種情況下,--mount
標誌接受兩個引數:source
和 target
。source
引數的值是卷的名稱。target
的值是卷在容器內的掛載位置。建立卷後,您寫入卷的任何資料都會持久化,即使您停止或移除容器也是如此。
$ docker run --rm --mount source=my_volume,target=/foo busybox \
echo "hello, volume!" > /foo/hello.txt
$ docker run --mount source=my_volume,target=/bar busybox
cat /bar/hello.txt
hello, volume!
target
必須始終是絕對路徑,例如 /src/docs
。絕對路徑以 /
(正斜槓)開頭。卷名稱必須以字母數字字元開頭,後跟 a-z0-9
、_
(下劃線)、.
(點)或 -
(連字元)。
繫結掛載
建立繫結掛載:
$ docker run -it --mount type=bind,source=[PATH],target=[PATH] busybox
在這種情況下,--mount
標誌接受三個引數。一個型別(bind
)和兩個路徑。source
路徑是您想要繫結掛載到容器中的主機位置。target
路徑是容器內的掛載目標。
繫結掛載預設是讀寫的,這意味著您可以從容器中讀取和寫入掛載位置的檔案。您所做的更改,例如新增或編輯檔案,會反映在主機檔案系統上。
$ docker run -it --mount type=bind,source=.,target=/foo busybox
/ # echo "hello from container" > /foo/hello.txt
/ # exit
$ cat hello.txt
hello from container
退出狀態
docker run
的退出程式碼提供了關於容器為何執行失敗或為何退出的資訊。以下部分描述了不同容器退出程式碼值的含義。
125
退出程式碼 125
表示錯誤出在 Docker 守護程序本身。
$ docker run --foo busybox; echo $?
flag provided but not defined: --foo
See 'docker run --help'.
125
126
退出程式碼 126
表示無法呼叫指定的容器命令。以下示例中的容器命令是:/etc
。
$ docker run busybox /etc; echo $?
docker: Error response from daemon: Container command '/etc' could not be invoked.
126
127
退出碼 127
表示包含的命令未找到。
$ docker run busybox foo; echo $?
docker: Error response from daemon: Container command 'foo' not found or does not exist.
127
其他退出程式碼
除 125
、126
和 127
之外的任何退出碼錶示所提供的容器命令的退出碼。
$ docker run busybox /bin/sh -c 'exit 3'
$ echo $?
3
資源執行時限制
運維人員也可以調整容器的效能引數
選項 | 描述 |
---|---|
-m , --memory="" | 記憶體限制(格式:<number>[<unit>] )。Number 是一個正整數。Unit 可以是 b 、k 、m 或 g 中的一個。最小值為 6M。 |
--memory-swap="" | 總記憶體限制(記憶體 + 交換空間,格式:<number>[<unit>] )。Number 是一個正整數。Unit 可以是 b 、k 、m 或 g 中的一個。 |
--memory-reservation="" | 記憶體軟限制(格式:<number>[<unit>] )。Number 是一個正整數。Unit 可以是 b 、k 、m 或 g 中的一個。 |
--kernel-memory="" | 核心記憶體限制(格式:<number>[<unit>] )。Number 是一個正整數。Unit 可以是 b 、k 、m 或 g 中的一個。最小值為 4M。 |
-c , --cpu-shares=0 | CPU 份額(相對權重) |
--cpus=0.000 | CPU 數量。Number 是一個小數。0.000 表示沒有限制。 |
--cpu-period=0 | 限制 CPU CFS (完全公平排程器) 週期 |
--cpuset-cpus="" | 允許執行的 CPU (0-3, 0,1) |
--cpuset-mems="" | 允許執行的記憶體節點 (MEMs) (0-3, 0,1)。僅在 NUMA 系統上有效。 |
--cpu-quota=0 | 限制 CPU CFS (完全公平排程器) 配額 |
--cpu-rt-period=0 | 限制 CPU 即時週期。以微秒為單位。需要設定父 cgroups 且不能高於父級。同時檢查 rtprio ulimits。 |
--cpu-rt-runtime=0 | 限制 CPU 即時執行時長。以微秒為單位。需要設定父 cgroups 且不能高於父級。同時檢查 rtprio ulimits。 |
--blkio-weight=0 | 塊 IO 權重(相對權重)接受一個介於 10 到 1000 之間的權重值。 |
--blkio-weight-device="" | 塊 IO 權重(相對裝置權重,格式:DEVICE_NAME:WEIGHT ) |
--device-read-bps="" | 限制從裝置讀取速率(格式:<device-path>:<number>[<unit>] )。Number 是一個正整數。Unit 可以是 kb 、mb 或 gb 中的一個。 |
--device-write-bps="" | 限制寫入裝置的速率(格式:<device-path>:<number>[<unit>] )。Number 是一個正整數。Unit 可以是 kb 、mb 或 gb 中的一個。 |
--device-read-iops="" | 限制從裝置讀取速率(每秒 IO 數)(格式:<device-path>:<number> )。Number 是一個正整數。 |
--device-write-iops="" | 限制寫入裝置的速率(每秒 IO 數)(格式:<device-path>:<number> )。Number 是一個正整數。 |
--oom-kill-disable=false | 是否停用容器的 OOM Killer。 |
--oom-score-adj=0 | 調整容器的 OOM 優先順序 (-1000 到 1000) |
--memory-swappiness="" | 調整容器的記憶體 swappiness 行為。接受一個介於 0 到 100 之間的整數。 |
--shm-size="" | /dev/shm 的大小。格式為 <number><unit> 。number 必須大於 0 。unit 是可選的,可以是 b (位元組)、k (千位元組)、m (兆位元組) 或 g (千兆位元組)。如果省略 unit ,系統將使用位元組。如果完全省略 size ,系統將使用 64m 。 |
使用者記憶體限制
我們有四種方式設定使用者記憶體使用量
選項 | 結果 |
---|---|
memory=inf, memory-swap=inf (default) | 容器沒有記憶體限制。容器可以根據需要使用任意多的記憶體。 |
memory=L<inf, memory-swap=inf | (指定記憶體並將 memory-swap 設定為 -1 )容器不允許使用超過 L 位元組的記憶體,但可以使用任意多的交換空間(如果主機支援交換記憶體)。 |
memory=L<inf, memory-swap=2*L | (只指定記憶體而不指定 memory-swap )容器不允許使用超過 L 位元組的記憶體,交換空間 加上 記憶體使用量是該值的兩倍。 |
memory=L<inf, memory-swap=S<inf, L<=S | (同時指定記憶體和 memory-swap )容器不允許使用超過 L 位元組的記憶體,交換空間 加上 記憶體使用量受 S 限制。 |
示例
$ docker run -it ubuntu:24.04 /bin/bash
我們沒有設定關於記憶體的任何限制,這意味著容器中的程序可以根據需要使用任意多的記憶體和交換空間。
$ docker run -it -m 300M --memory-swap -1 ubuntu:24.04 /bin/bash
我們設定了記憶體限制並停用了交換空間限制,這意味著容器中的程序可以使用 300M 記憶體,並根據需要使用任意多的交換空間(如果主機支援交換記憶體)。
$ docker run -it -m 300M ubuntu:24.04 /bin/bash
我們只設置了記憶體限制,這意味著容器中的程序可以使用 300M 記憶體和 300M 交換空間;預設情況下,總虛擬記憶體大小(--memory-swap
)將設定為記憶體的兩倍,在本例中,記憶體 + 交換空間將是 2*300M,因此程序也可以使用 300M 交換空間。
$ docker run -it -m 300M --memory-swap 1G ubuntu:24.04 /bin/bash
我們同時設定了記憶體和交換空間,因此容器中的程序可以使用 300M 記憶體和 700M 交換空間。
記憶體預留是一種記憶體軟限制,它允許更好地共享記憶體。在正常情況下,容器可以根據需要使用任意多的記憶體,並且僅受透過 -m
/--memory
選項設定的硬限制約束。設定記憶體預留後,Docker 會檢測記憶體爭用或低記憶體情況,並強制容器將其消耗限制在預留限制內。
務必將記憶體預留值設定在硬限制之下,否則硬限制將優先。預留值為 0 等同於未設定預留。預設情況下(未設定預留時),記憶體預留等於硬記憶體限制。
記憶體預留是軟限制功能,不能保證限制不會被超出。相反,該功能試圖確保在記憶體嚴重爭用時,根據預留提示/設定分配記憶體。
以下示例將記憶體 (-m
) 限制為 500M,並將記憶體預留設定為 200M。
$ docker run -it -m 500M --memory-reservation 200M ubuntu:24.04 /bin/bash
在此配置下,當容器消耗的記憶體超過 200M 但小於 500M 時,下一次系統記憶體回收會嘗試將容器記憶體縮小到 200M 以下。
以下示例將記憶體預留設定為 1G,未設定硬記憶體限制。
$ docker run -it --memory-reservation 1G ubuntu:24.04 /bin/bash
容器可以根據需要使用任意多的記憶體。記憶體預留設定確保容器長時間內不會消耗過多記憶體,因為每次記憶體回收都會將容器的消耗量縮小到預留值。
預設情況下,如果發生記憶體不足 (OOM) 錯誤,核心會殺死容器中的程序。要更改此行為,請使用 --oom-kill-disable
選項。僅在同時設定了 -m
/--memory
選項的容器上停用 OOM killer。如果未設定 -m
標誌,可能會導致主機記憶體不足,需要殺死主機系統程序以釋放記憶體。
以下示例將記憶體限制為 100M 並停用此容器的 OOM killer
$ docker run -it -m 100M --oom-kill-disable ubuntu:24.04 /bin/bash
以下示例說明了使用此標誌的一種危險方式
$ docker run -it --oom-kill-disable ubuntu:24.04 /bin/bash
容器具有無限記憶體,這可能導致主機記憶體不足,需要殺死系統程序以釋放記憶體。可以更改 --oom-score-adj
引數來選擇系統記憶體不足時要殺死的容器的優先順序,負分使其不太可能被殺死,正分則更可能被殺死。
核心記憶體限制
核心記憶體與使用者記憶體有著根本區別,因為核心記憶體無法換出。無法換出使得容器有可能透過消耗過多的核心記憶體來阻塞系統服務。核心記憶體包括:
- 堆疊頁
- slab 頁
- socket 記憶體壓力
- tcp 記憶體壓力
您可以設定核心記憶體限制來約束這些型別的記憶體。例如,每個程序都會消耗一些堆疊頁。透過限制核心記憶體,您可以在核心記憶體使用過高時阻止建立新程序。
核心記憶體永遠不會完全獨立於使用者記憶體。相反,您是在使用者記憶體限制的上下文中限制核心記憶體。假設 "U" 是使用者記憶體限制,“K” 是核心限制。有三種可能的限制設定方式
選項 | 結果 |
---|---|
U != 0, K = inf (default) | 這是在使用核心記憶體之前已經存在的標準記憶體限制機制。核心記憶體完全被忽略。 |
U != 0, K < U | 核心記憶體是使用者記憶體的一個子集。這種設定在每個 cgroup 的總記憶體過量分配(overcommitted)的部署中很有用。過量分配核心記憶體限制絕對不推薦,因為主機仍然可能耗盡不可回收的記憶體。在這種情況下,您可以配置 K,使所有組的總和永遠不大於總記憶體。然後,可以自由設定 U,但會犧牲系統的服務質量。 |
U != 0, K > U | 由於核心記憶體消耗也會計入使用者計數器,並且會針對容器觸發兩種記憶體的回收。此配置為管理員提供了統一的記憶體檢視。對於只想跟蹤核心記憶體使用量的人來說也很有用。 |
示例
$ docker run -it -m 500M --kernel-memory 50M ubuntu:24.04 /bin/bash
我們設定了記憶體和核心記憶體,因此容器中的程序總共可以使用 500M 記憶體,在這 500M 記憶體中,最多可以使用 50M 核心記憶體。
$ docker run -it --kernel-memory 50M ubuntu:24.04 /bin/bash
我們在未設定 -m
的情況下設定了核心記憶體,因此容器中的程序可以使用任意多的記憶體,但只能使用 50M 核心記憶體。
Swappiness 限制
預設情況下,容器的核心可以換出一定比例的匿名頁。要為容器設定此百分比,請指定一個介於 0 到 100 之間的 --memory-swappiness
值。值為 0 表示關閉匿名頁換出。值為 100 表示將所有匿名頁設定為可換出。預設情況下,如果您未使用 --memory-swappiness
,記憶體 swappiness 值將從父級繼承。
例如,您可以設定
$ docker run -it --memory-swappiness=0 ubuntu:24.04 /bin/bash
設定 --memory-swappiness
選項有助於保留容器的工作集並避免換出帶來的效能損失。
CPU 份額限制
預設情況下,所有容器獲得相同比例的 CPU 週期。可以透過更改容器相對於所有其他執行容器的 CPU 份額權重來修改此比例。
要修改預設的 1024 比例,請使用 -c
或 --cpu-shares
標誌將權重設定為 2 或更高。如果設定為 0,系統將忽略該值並使用預設值 1024。
該比例僅在執行 CPU 密集型程序時適用。當一個容器中的任務處於空閒狀態時,其他容器可以使用剩餘的 CPU 時間。實際獲得的 CPU 時間量將根據系統上執行的容器數量而有所不同。
例如,考慮三個容器,一個的 cpu-share 為 1024,另外兩個的 cpu-share 設定為 512。當所有三個容器中的程序都嘗試使用 100% 的 CPU 時,第一個容器將獲得總 CPU 時間的 50%。如果您新增第四個 cpu-share 為 1024 的容器,則第一個容器僅獲得 33% 的 CPU。其餘容器分別獲得 16.5%、16.5% 和 33% 的 CPU。
在多核系統上,CPU 時間的份額分佈在所有 CPU 核上。即使容器的 CPU 時間被限制在低於 100%,它仍然可以使用每個獨立 CPU 核的 100%。
例如,考慮一個擁有三個以上核的系統。如果您啟動一個 -c=512
執行一個程序的容器 {C0}
,以及另一個 -c=1024
執行兩個程序的容器 {C1}
,則可能導致以下 CPU 份額劃分
PID container CPU CPU share
100 {C0} 0 100% of CPU0
101 {C1} 1 100% of CPU1
102 {C1} 2 100% of CPU2
CPU 週期限制
預設的 CPU CFS (完全公平排程器) 週期是 100ms。我們可以使用 --cpu-period
來設定 CPU 週期以限制容器的 CPU 使用率。通常 --cpu-period
應該與 --cpu-quota
一起使用。
示例
$ docker run -it --cpu-period=50000 --cpu-quota=25000 ubuntu:24.04 /bin/bash
如果有一個 CPU,這意味著容器每 50ms 可以獲得相當於 50% CPU 的執行時間。
除了使用 --cpu-period
和 --cpu-quota
設定 CPU 週期限制外,也可以使用浮點數指定 --cpus
來達到相同的目的。例如,如果有 1 個 CPU,那麼 --cpus=0.5
將實現與設定 --cpu-period=50000
和 --cpu-quota=25000
(50% CPU) 相同的結果。
--cpus
的預設值是 0.000
,這意味著沒有限制。
更多資訊請參閱 CFS 頻寬限制文件。
Cpuset 限制
我們可以設定允許容器在哪些 CPU 上執行。
示例
$ docker run -it --cpuset-cpus="1,3" ubuntu:24.04 /bin/bash
這意味著容器中的程序可以在 cpu 1 和 cpu 3 上執行。
$ docker run -it --cpuset-cpus="0-2" ubuntu:24.04 /bin/bash
這意味著容器中的程序可以在 cpu 0、cpu 1 和 cpu 2 上執行。
我們可以設定允許容器在哪些記憶體節點上執行。僅在 NUMA 系統上有效。
示例
$ docker run -it --cpuset-mems="1,3" ubuntu:24.04 /bin/bash
此示例將容器中的程序限制為僅使用記憶體節點 1 和 3 的記憶體。
$ docker run -it --cpuset-mems="0-2" ubuntu:24.04 /bin/bash
此示例將容器中的程序限制為僅使用記憶體節點 0、1 和 2 的記憶體。
CPU 配額限制
--cpu-quota
標誌限制容器的 CPU 使用率。預設值 0 允許容器佔用 100% 的 CPU 資源(1 個 CPU)。CFS (完全公平排程器) 處理執行程序的資源分配,並且是核心使用的預設 Linux 排程器。將此值設定為 50000 可將容器限制為 50% 的 CPU 資源。對於多個 CPU,請根據需要調整 --cpu-quota
。更多資訊請參閱 CFS 頻寬限制文件。
塊 IO 頻寬 (Blkio) 限制
預設情況下,所有容器獲得相同比例的塊 IO 頻寬 (blkio)。此比例為 500。要修改此比例,請使用 --blkio-weight
標誌更改容器相對於所有其他執行容器的 blkio 權重。
注意
blkio 權重設定僅適用於直接 IO。當前不支援緩衝 IO。
--blkio-weight
標誌可以將權重設定為介於 10 到 1000 之間的值。例如,以下命令建立兩個具有不同 blkio 權重的容器
$ docker run -it --name c1 --blkio-weight 300 ubuntu:24.04 /bin/bash
$ docker run -it --name c2 --blkio-weight 600 ubuntu:24.04 /bin/bash
如果您同時在兩個容器中進行塊 IO 操作,例如
$ time dd if=/mnt/zerofile of=test.out bs=1M count=1024 oflag=direct
您會發現花費的時間比例與兩個容器的 blkio 權重比例相同。
--blkio-weight-device="DEVICE_NAME:WEIGHT"
標誌設定特定裝置的權重。DEVICE_NAME:WEIGHT
是一個包含冒號分隔的裝置名稱和權重的字串。例如,要將 /dev/sda
裝置的權重設定為 200
$ docker run -it \
--blkio-weight-device "/dev/sda:200" \
ubuntu
如果同時指定 --blkio-weight
和 --blkio-weight-device
,Docker 將使用 --blkio-weight
作為預設權重,並使用 --blkio-weight-device
在特定裝置上用新值覆蓋此預設值。以下示例使用預設權重 300
,並在 /dev/sda
上覆蓋此預設值,將其權重設定為 200
$ docker run -it \
--blkio-weight 300 \
--blkio-weight-device "/dev/sda:200" \
ubuntu
--device-read-bps
標誌限制從裝置的讀取速率(位元組/秒)。例如,此命令建立了一個容器並限制從 /dev/sda
的讀取速率為每秒 1mb
$ docker run -it --device-read-bps /dev/sda:1mb ubuntu
--device-write-bps
標誌限制寫入裝置的速率(位元組/秒)。例如,此命令建立了一個容器並限制寫入 /dev/sda
的速率為每秒 1mb
$ docker run -it --device-write-bps /dev/sda:1mb ubuntu
這兩個標誌都接受 <device-path>:<limit>[unit]
格式的限制。讀取和寫入速率都必須是正整數。您可以以 kb
(千位元組)、mb
(兆位元組) 或 gb
(千兆位元組) 為單位指定速率。
--device-read-iops
標誌限制從裝置的讀取速率(每秒 IO 數)。例如,此命令建立了一個容器並限制從 /dev/sda
的讀取速率為每秒 1000
IO
$ docker run -it --device-read-iops /dev/sda:1000 ubuntu
--device-write-iops
標誌限制寫入裝置的速率(每秒 IO 數)。例如,此命令建立了一個容器並限制寫入 /dev/sda
的速率為每秒 1000
IO
$ docker run -it --device-write-iops /dev/sda:1000 ubuntu
這兩個標誌都接受 <device-path>:<limit>
格式的限制。讀取和寫入速率都必須是正整數。
附加組
--group-add: Add additional groups to run as
預設情況下,docker 容器程序以查詢指定使用者的補充組執行。如果要向該組列表中新增更多組,則可以使用此標誌
$ docker run --rm --group-add audio --group-add nogroup --group-add 777 busybox id
uid=0(root) gid=0(root) groups=10(wheel),29(audio),99(nogroup),777
執行時特權和 Linux 能力
選項 | 描述 |
---|---|
--cap-add | 新增 Linux 能力(capabilities) |
--cap-drop | 刪除 Linux 能力(capabilities) |
--privileged | 為此容器提供擴充套件許可權 |
--device=[] | 允許您在不使用 --privileged 標誌的情況下在容器內執行裝置。 |
預設情況下,Docker 容器是“非特權”的,例如,不能在 Docker 容器內部執行 Docker daemon。這是因為預設情況下不允許容器訪問任何裝置,但“特權”容器被授予訪問所有裝置的許可權(參見關於 cgroups 裝置的文件)。
--privileged
標誌為容器提供所有能力。當運維人員執行 docker run --privileged
時,Docker 會啟用對主機上所有裝置的訪問,並重新配置 AppArmor 或 SELinux,以允許容器獲得與主機上容器外部執行的程序幾乎相同的訪問許可權。請謹慎使用此標誌。有關 --privileged
標誌的更多資訊,請參閱 docker run
參考文件。
如果您想限制對特定裝置或多個裝置的訪問,可以使用 --device
標誌。它允許您指定一個或多個在容器內可訪問的裝置。
$ docker run --device=/dev/snd:/dev/snd ...
預設情況下,容器將能夠 read
、write
和 mknod
這些裝置。可以使用第三個 :rwm
選項集覆蓋每個 --device
標誌的此預設設定
$ docker run --device=/dev/sda:/dev/xvdc --rm -it ubuntu fdisk /dev/xvdc
Command (m for help): q
$ docker run --device=/dev/sda:/dev/xvdc:r --rm -it ubuntu fdisk /dev/xvdc
You will not be able to write the partition table.
Command (m for help): q
$ docker run --device=/dev/sda:/dev/xvdc:w --rm -it ubuntu fdisk /dev/xvdc
crash....
$ docker run --device=/dev/sda:/dev/xvdc:m --rm -it ubuntu fdisk /dev/xvdc
fdisk: unable to open /dev/xvdc: Operation not permitted
除了 --privileged
之外,運維人員可以使用 --cap-add
和 --cap-drop
對能力進行細粒度控制。預設情況下,Docker 保留了一組預設的能力列表。下表列出了預設允許且可以刪除的 Linux 能力選項。
能力鍵 | 能力描述 |
---|---|
AUDIT_WRITE | 將記錄寫入核心審計日誌。 |
CHOWN | 對檔案 UID 和 GID 進行任意更改(參見 chown(2))。 |
DAC_OVERRIDE | 繞過檔案讀取、寫入和執行許可權檢查。 |
FOWNER | 繞過通常需要程序的檔案系統 UID 與檔案的 UID 匹配的操作的許可權檢查。 |
FSETID | 修改檔案時不清空 set-user-ID 和 set-group-ID 許可權位。 |
KILL | 繞過傳送訊號的許可權檢查。 |
MKNOD | 使用 mknod(2) 建立特殊檔案。 |
NET_BIND_SERVICE | 將 socket 繫結到網際網路域特權埠(埠號小於 1024)。 |
NET_RAW | 使用 RAW 和 PACKET socket。 |
SETFCAP | 設定檔案能力。 |
SETGID | 對程序 GID 和補充 GID 列表進行任意操作。 |
SETPCAP | 修改程序能力。 |
SETUID | 對程序 UID 進行任意操作。 |
SYS_CHROOT | 使用 chroot(2),更改根目錄。 |
下表顯示了預設未授予但可以新增的能力。
能力鍵 | 能力描述 |
---|---|
AUDIT_CONTROL | 啟用和停用核心審計;更改審計過濾規則;檢索審計狀態和過濾規則。 |
AUDIT_READ | 允許透過多播 netlink socket 讀取審計日誌。 |
BLOCK_SUSPEND | 允許阻止系統掛起。 |
BPF | 允許建立 BPF map,載入 BPF 型別格式 (BTF) 資料,檢索 BPF 程式的 JIT 編譯程式碼等。 |
CHECKPOINT_RESTORE | 允許與檢查點/恢復相關的操作。在 kernel 5.9 中引入。 |
DAC_READ_SEARCH | 繞過檔案讀取許可權檢查以及目錄讀取和執行許可權檢查。 |
IPC_LOCK | 鎖定記憶體 (mlock(2), mlockall(2), mmap(2), shmctl(2))。 |
IPC_OWNER | 繞過對 System V IPC 物件的許可權檢查。 |
LEASE | 在任意檔案上建立租約(參見 fcntl(2))。 |
LINUX_IMMUTABLE | 設定 FS_APPEND_FL 和 FS_IMMUTABLE_FL i-node 標誌。 |
MAC_ADMIN | 允許 MAC 配置或狀態更改。針對 Smack LSM 實現。 |
MAC_OVERRIDE | 覆蓋強制訪問控制 (MAC)。針對 Smack Linux 安全模組 (LSM) 實現。 |
NET_ADMIN | 執行各種與網路相關的操作。 |
NET_BROADCAST | 進行 socket 廣播,並監聽多播。 |
PERFMON | 允許使用 perf_events、i915_perf 和其他核心子系統執行系統性能和可觀測性特權操作 |
SYS_ADMIN | 執行一系列系統管理操作。 |
SYS_BOOT | 使用 reboot(2) 和 kexec_load(2),重啟並載入新核心以供後續執行。 |
SYS_MODULE | 載入和解除安裝核心模組。 |
SYS_NICE | 提高程序的 nice 值 (nice(2), setpriority(2)) 並更改任意程序的 nice 值。 |
SYS_PACCT | 使用 acct(2),開啟或關閉程序記賬。 |
SYS_PTRACE | 使用 ptrace(2) 跟蹤任意程序。 |
SYS_RAWIO | 執行 I/O 埠操作 (iopl(2) 和 ioperm(2))。 |
SYS_RESOURCE | 覆蓋資源限制。 |
SYS_TIME | 設定系統時鐘 (settimeofday(2), stime(2), adjtimex(2));設定即時(硬體)時鐘。 |
SYS_TTY_CONFIG | 使用 vhangup(2);在虛擬終端上使用各種特權 ioctl(2) 操作。 |
SYSLOG | 執行特權 syslog(2) 操作。 |
WAKE_ALARM | 觸發喚醒系統的操作。 |
更多參考資訊可在 capabilities(7) - Linux man 手冊頁 和 Linux 核心原始碼中。
這兩個標誌都支援值 ALL
,因此要允許容器使用除 MKNOD
之外的所有能力
$ docker run --cap-add=ALL --cap-drop=MKNOD ...
--cap-add
和 --cap-drop
標誌接受帶 CAP_
字首指定的能力。因此,以下示例是等效的
$ docker run --cap-add=SYS_ADMIN ...
$ docker run --cap-add=CAP_SYS_ADMIN ...
對於與網路堆疊互動,他們不應使用 --privileged
,而應使用 --cap-add=NET_ADMIN
來修改網路介面。
$ docker run -it --rm ubuntu:24.04 ip link add dummy0 type dummy
RTNETLINK answers: Operation not permitted
$ docker run -it --rm --cap-add=NET_ADMIN ubuntu:24.04 ip link add dummy0 type dummy
要掛載基於 FUSE 的檔案系統,您需要結合使用 --cap-add
和 --device
$ docker run --rm -it --cap-add SYS_ADMIN sshfs sshfs sven@10.10.10.20:/home/sven /mnt
fuse: failed to open /dev/fuse: Operation not permitted
$ docker run --rm -it --device /dev/fuse sshfs sshfs sven@10.10.10.20:/home/sven /mnt
fusermount: mount failed: Operation not permitted
$ docker run --rm -it --cap-add SYS_ADMIN --device /dev/fuse sshfs
# sshfs sven@10.10.10.20:/home/sven /mnt
The authenticity of host '10.10.10.20 (10.10.10.20)' can't be established.
ECDSA key fingerprint is 25:34:85:75:25:b0:17:46:05:19:04:93:b5:dd:5f:c6.
Are you sure you want to continue connecting (yes/no)? yes
sven@10.10.10.20's password:
root@30aa0cfaf1b5:/# ls -la /mnt/src/docker
total 1516
drwxrwxr-x 1 1000 1000 4096 Dec 4 06:08 .
drwxrwxr-x 1 1000 1000 4096 Dec 4 11:46 ..
-rw-rw-r-- 1 1000 1000 16 Oct 8 00:09 .dockerignore
-rwxrwxr-x 1 1000 1000 464 Oct 8 00:09 .drone.yml
drwxrwxr-x 1 1000 1000 4096 Dec 4 06:11 .git
-rw-rw-r-- 1 1000 1000 461 Dec 4 06:08 .gitignore
....
預設的 seccomp 配置檔案會根據所選的能力進行調整,以允許使用能力所允許的功能,因此您應該不需要調整此項。
覆蓋映象預設設定
當您從 Dockerfile 構建映象或提交映象時,您可以設定一些預設引數,這些引數在映象作為容器啟動時生效。執行映象時,您可以使用 docker run
命令的標誌覆蓋這些預設值。
預設命令和選項
docker run
的命令語法支援可選地為容器的 entrypoint 指定命令和引數,在以下概要示例中表示為 [COMMAND]
和 [ARG...]
$ docker run [OPTIONS] IMAGE[:TAG|@DIGEST] [COMMAND] [ARG...]
此命令是可選的,因為建立 IMAGE
的人可能已經使用 Dockerfile CMD
指令提供了一個預設 COMMAND
。執行容器時,您只需指定新的 COMMAND
即可覆蓋該 CMD
指令。
如果映象還指定了 ENTRYPOINT
,則 CMD
或 COMMAND
將作為引數追加到 ENTRYPOINT
後面。
預設入口點
--entrypoint="": Overwrite the default entrypoint set by the image
entrypoint 指的是執行容器時呼叫的預設可執行檔案。容器的 entrypoint 使用 Dockerfile ENTRYPOINT
指令定義。它類似於指定預設命令,因為它指定了,但區別在於您需要傳遞一個顯式標誌來覆蓋 entrypoint,而可以使用位置引數覆蓋預設命令。Entrypoint 定義了容器的預設行為,其理念是當您設定 entrypoint 時,可以 像執行該二進位制檔案一樣 執行容器,附帶預設選項,並且可以傳遞更多選項作為命令。但在某些情況下,您可能想在容器內執行其他東西。這時在執行時使用 docker run
命令的 --entrypoint
標誌覆蓋預設 entrypoint 就派上用場了。
--entrypoint
標誌需要一個字串值,表示容器啟動時要呼叫的二進位制檔案的名稱或路徑。以下示例展示瞭如何在已設定為自動執行其他二進位制檔案(如 /usr/bin/redis-server
)的容器中執行 Bash shell
$ docker run -it --entrypoint /bin/bash example/redis
以下示例展示瞭如何使用位置命令引數將附加引數傳遞給自定義 entrypoint
$ docker run -it --entrypoint /bin/bash example/redis -c ls -l
$ docker run -it --entrypoint /usr/bin/redis-cli example/redis --help
您可以透過傳遞空字串來重置容器的 entrypoint,例如
$ docker run -it --entrypoint="" mysql bash
注意
傳遞
--entrypoint
會清除映象上設定的所有預設命令。也就是說,用於構建映象的 Dockerfile 中的任何CMD
指令。
暴露埠
預設情況下,執行容器時,容器的任何埠都不會暴露給主機。這意味著您將無法訪問容器可能監聽的任何埠。要使容器的埠可以從主機訪問,您需要釋出埠。
您可以使用 -P
或 -p
標誌啟動容器以暴露其埠
-P
(或--publish-all
)標誌將所有暴露的埠釋出到主機。Docker 將每個暴露的埠繫結到主機上的一個隨機埠。-P
標誌僅釋出那些被明確標記為暴露的埠號,這可以透過 Dockerfile 的EXPOSE
指令或docker run
命令的--expose
標誌實現。-p
(或--publish
)標誌允許您將容器中的單個埠或埠範圍顯式對映到宿主機。
容器內部的埠號(服務監聽的埠)不需要與容器外部發布的埠號(客戶端連線的埠)匹配。例如,在容器內部,一個 HTTP 服務可能正在監聽埠 80。執行時,該埠在宿主機上可能被繫結到 42800。要查詢宿主機埠和暴露埠之間的對映關係,請使用 docker port
命令。
環境變數
建立 Linux 容器時,Docker 會自動設定一些環境變數。建立 Windows 容器時,Docker 不會設定任何環境變數。
為 Linux 容器設定了以下環境變數
變數 | 值 |
---|---|
HOME | 基於 USER 的值設定 |
HOSTNAME | 與容器關聯的主機名 |
PATH | 包含常用目錄,例如 /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin |
TERM | 如果為容器分配了偽 TTY,則為 xterm |
此外,您可以使用一個或多個 -e
標誌在容器中設定任何環境變數。您甚至可以覆蓋上面提到的變數,或在使用 Dockerfile ENV
指令構建映象時定義的變數。
如果您指定環境變數名稱但不指定值,則宿主機上該命名變數的當前值會傳播到容器的環境中
$ export today=Wednesday
$ docker run -e "deep=purple" -e today --rm alpine env
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
HOSTNAME=d2219b854598
deep=purple
today=Wednesday
HOME=/root
PS C:\> docker run --rm -e "foo=bar" microsoft/nanoserver cmd /s /c set
ALLUSERSPROFILE=C:\ProgramData
APPDATA=C:\Users\ContainerAdministrator\AppData\Roaming
CommonProgramFiles=C:\Program Files\Common Files
CommonProgramFiles(x86)=C:\Program Files (x86)\Common Files
CommonProgramW6432=C:\Program Files\Common Files
COMPUTERNAME=C2FAEFCC8253
ComSpec=C:\Windows\system32\cmd.exe
foo=bar
LOCALAPPDATA=C:\Users\ContainerAdministrator\AppData\Local
NUMBER_OF_PROCESSORS=8
OS=Windows_NT
Path=C:\Windows\system32;C:\Windows;C:\Windows\System32\Wbem;C:\Windows\System32\WindowsPowerShell\v1.0\;C:\Users\ContainerAdministrator\AppData\Local\Microsoft\WindowsApps
PATHEXT=.COM;.EXE;.BAT;.CMD
PROCESSOR_ARCHITECTURE=AMD64
PROCESSOR_IDENTIFIER=Intel64 Family 6 Model 62 Stepping 4, GenuineIntel
PROCESSOR_LEVEL=6
PROCESSOR_REVISION=3e04
ProgramData=C:\ProgramData
ProgramFiles=C:\Program Files
ProgramFiles(x86)=C:\Program Files (x86)
ProgramW6432=C:\Program Files
PROMPT=$P$G
PUBLIC=C:\Users\Public
SystemDrive=C:
SystemRoot=C:\Windows
TEMP=C:\Users\ContainerAdministrator\AppData\Local\Temp
TMP=C:\Users\ContainerAdministrator\AppData\Local\Temp
USERDOMAIN=User Manager
USERNAME=ContainerAdministrator
USERPROFILE=C:\Users\ContainerAdministrator
windir=C:\Windows
健康檢查
docker run
命令的以下標誌允許您控制容器健康檢查的引數
選項 | 描述 |
---|---|
--health-cmd | 用於檢查健康的命令 |
--health-interval | 執行檢查之間的時間間隔 |
--health-retries | 報告不健康所需的連續失敗次數 |
--health-timeout | 允許一次檢查執行的最大時間 |
--health-start-period | 容器在開始健康檢查重試倒計時之前的啟動週期 |
--health-start-interval | 啟動週期內執行檢查之間的時間間隔 |
--no-healthcheck | 停用容器指定的任何 HEALTHCHECK |
示例
$ docker run --name=test -d \
--health-cmd='stat /etc/passwd || exit 1' \
--health-interval=2s \
busybox sleep 1d
$ sleep 2; docker inspect --format='{{.State.Health.Status}}' test
healthy
$ docker exec test rm /etc/passwd
$ sleep 2; docker inspect --format='{{json .State.Health}}' test
{
"Status": "unhealthy",
"FailingStreak": 3,
"Log": [
{
"Start": "2016-05-25T17:22:04.635478668Z",
"End": "2016-05-25T17:22:04.7272552Z",
"ExitCode": 0,
"Output": " File: /etc/passwd\n Size: 334 \tBlocks: 8 IO Block: 4096 regular file\nDevice: 32h/50d\tInode: 12 Links: 1\nAccess: (0664/-rw-rw-r--) Uid: ( 0/ root) Gid: ( 0/ root)\nAccess: 2015-12-05 22:05:32.000000000\nModify: 2015..."
},
{
"Start": "2016-05-25T17:22:06.732900633Z",
"End": "2016-05-25T17:22:06.822168935Z",
"ExitCode": 0,
"Output": " File: /etc/passwd\n Size: 334 \tBlocks: 8 IO Block: 4096 regular file\nDevice: 32h/50d\tInode: 12 Links: 1\nAccess: (0664/-rw-rw-r--) Uid: ( 0/ root) Gid: ( 0/ root)\nAccess: 2015-12-05 22:05:32.000000000\nModify: 2015..."
},
{
"Start": "2016-05-25T17:22:08.823956535Z",
"End": "2016-05-25T17:22:08.897359124Z",
"ExitCode": 1,
"Output": "stat: can't stat '/etc/passwd': No such file or directory\n"
},
{
"Start": "2016-05-25T17:22:10.898802931Z",
"End": "2016-05-25T17:22:10.969631866Z",
"ExitCode": 1,
"Output": "stat: can't stat '/etc/passwd': No such file or directory\n"
},
{
"Start": "2016-05-25T17:22:12.971033523Z",
"End": "2016-05-25T17:22:13.082015516Z",
"ExitCode": 1,
"Output": "stat: can't stat '/etc/passwd': No such file or directory\n"
}
]
}
健康狀態也會顯示在 docker ps
輸出中。
使用者
容器內的預設使用者是 root
(uid = 0)。您可以使用 Dockerfile 的 USER
指令設定預設使用者來執行第一個程序。啟動容器時,您可以透過傳遞 -u
選項來覆蓋 USER
指令。
-u="", --user="": Sets the username or UID used and optionally the groupname or GID for the specified command.
以下所有示例均有效
--user=[ user | user:group | uid | uid:gid | user:gid | uid:group ]
注意
如果您傳遞數字使用者 ID,它必須在 0-2147483647 的範圍內。如果您傳遞使用者名稱,該使用者必須存在於容器中。
工作目錄
在容器內執行二進位制檔案的預設工作目錄是根目錄(/
)。映象的預設工作目錄是使用 Dockerfile 的 WORKDIR
命令設定的。您可以使用 docker run
命令的 -w
(或 --workdir
)標誌覆蓋映象的預設工作目錄
$ docker run --rm -w /my/workdir alpine pwd
/my/workdir
如果該目錄在容器中尚不存在,則會建立它。