•
多團隊系統中的階層悖論:為什麼結構的好處會自動消失,壞處卻不會
20 分鐘閱讀 •

多團隊系統(Multiteam Systems, MTS)的研究長期預設「階層有利」,Matusik 等人在 2022 年的 Academy of Management Journal 上發表了 The Highs and Lows of Hierarchy in Multiteam Systems,直接挑戰了這個假設。他們用 1,060 名參與者的實驗數據證明了一件值得注意的事,階層結構同時產生一個正面效果和一個負面效果,而正面效果會隨時間自動消失,負面效果持續存在。這篇文章拆解這個發現的理論基礎和實證邏輯,並從多 Agent AI 系統的角度提供我自己的分析。
論文在回答什麼問題
MTS 是由兩個以上的團隊組成的協作網絡,各團隊追求不同的近端目標,但共享至少一個遠端目標(Mathieu, Marks, & Zaccaro, 2001)。醫療照護系統、軍事行動、緊急應變、太空探索都屬於 MTS 的應用場景。
過去的 MTS 文獻幾乎一面倒地建議採用階層式結構(Luciano et al., 2021; Zaccaro et al., 2020),主要理由是階層能降低複雜性、提供清晰的決策鏈。但 Matusik 等人指出,這個建議忽略了獨立團隊文獻中已經被廣泛記錄的階層負面效果。
他們的研究問題分成三層。第一層問「如何」(How),即階層透過什麼機制影響 MTS。第二層問「為何」(Why),即這些機制背後的因果邏輯是什麼。第三層問「何時」(When),即這些效果是否隨時間改變。
階層的兩個相反機制
水平協調受損
水平協調指的是組成團隊「校準和同步彼此活動」的程度(de Vries et al., 2016)。論文的假設 H1 預測階層 MTS 的水平協調低於平等 MTS,結果獲得支持(B = -32.90, p < .01)。
Anderson & Brown(2010)在 Research in Organizational Behavior 上的回顧對此提供了系統性的解釋。階層引發競爭心態、權力鬥爭和人際衝突。當團隊之間存在正式的權力不對等,低位團隊傾向於隱瞞資訊(Hinsz & Betts, 2012),減少主動貢獻(Cronin et al., 2015),甚至進入防禦性的政治操作模式。
Greer 等人(2018)在 Journal of Applied Psychology 上的後設分析進一步佐證了這個發現,階層與協調促進過程之間存在負向關係。Matusik 等人的研究將這個已知的團隊內效應推廣到了團隊間的層次,證明跨團隊邊界的協調同樣會受到階層的抑制。
這裡我想補充一個觀察。MTS 的本質特徵是高度的跨團隊相互依賴(Shuffler & Carter, 2018),而 Anderson & Brown 明確指出,在工作高度相互依賴的情境中,階層的負面效果會被放大。換句話說,MTS 恰好是階層最容易造成協調傷害的組織形式。這個結構性矛盾——需要協調的場景偏偏用了抑制協調的結構——在我看來是整篇論文最值得思考的張力所在。
認知耗竭降低
認知耗竭指的是成員的心理能量被耗盡的程度(Porck et al., 2019)。論文的假設 H3 預測階層 MTS 的認知耗竭低於平等 MTS,結果獲得支持(B = -0.54, p < .01)。
論文整合了三個認知理論傳統來解釋階層降低認知負擔的機制。
第一個是認知流暢性(Cognitive Fluency)。Zitek & Tiedens(2012)的研究發現,階層結構比平等結構更容易被心理處理、理解和記憶。人類大腦對層級式資訊組織有天然的偏好,處理階層結構需要消耗更少的認知資源。
第二個是補償性控制(Compensatory Control)。Friesen 等人(2014)和 Landau 等人(2015)的研究指出,階層滿足了人類對確定性和組織的基本需求。在一個充滿不確定性的 MTS 環境中,階層提供了一種外部結構,讓成員感覺環境是有序且可預測的。
第三個是階層作為資訊過濾器的功能。在平等 MTS 中,所有團隊都需要處理來自系統各處的資訊流,在高複雜度環境下,這會迅速耗盡認知資源。階層透過集中決策,減少了每個團隊需要處理的資訊量。
我認為這三個理論之間存在一個共同的底層邏輯。階層本質上是一種「認知外包」機制,將決策的複雜性集中到少數節點,讓其他節點得以釋放認知資源。 這個機制的價值取決於一個前提條件,即成員自身尚未建立足夠的認知結構來應對環境的複雜性。這一點直接引出了下一個,也是我認為最重要的發現。
時間動態:好處會過期
整篇論文最精彩的部分是時間動態的分析。實驗設計包含三個績效回合(T1、T2、T3),這讓研究者得以觀察階層效果如何隨時間演變。
認知耗竭的差距迅速衰減
假設 H6 預測認知耗竭的差距會隨績效回合減小,結果獲得支持(交互項 B = 0.13, p < .05)。具體數字令人印象深刻:
- T1:階層 M = 2.21 vs 平等 M = 2.50(差距 0.29, p < .01)
- T2:階層 M = 2.42 vs 平等 M = 2.58(差距 0.17, p = .07,已經只是邊際顯著)
- T3:階層 M = 2.32 vs 平等 M = 2.38(差距 0.06, p = .49,完全不顯著)
作者提出了兩個互補的解釋。第一,隨著反覆暴露於 MTS 環境,成員會發展出基模(schemas)和心智模型(Fiske, 1995; Rouse & Morris, 1986),這些內建的認知結構取代了階層提供的外部結構。第二,團隊互動促進了交互記憶(transactive memory)的發展(Pearsall et al., 2010),減少了需要在任務中進行即時協調的不確定性。
我對這個衰減機制有一個延伸的思考。這個過程在結構上與 Vygotsky 的近側發展區理論(Zone of Proximal Development)非常相似。在近側發展區的框架中,學習者在初期依賴外部支撐(鷹架)來完成超出獨立能力的任務,隨著能力增長,鷹架逐步被移除。如果把階層當作一種「認知鷹架」(cognitive scaffolding),Matusik 等人的數據呈現的正是鷹架功能的自然消退。差異在於,MTS 中的這個「鷹架」不會自動被拆除,它的結構性副作用(協調損害)會繼續存在。
水平協調的差距持續存在
假設 H5 預測水平協調的差距會隨績效回合增加,但結果未獲支持(交互項 B = 5.80, p = .06)。不過更值得注意的是,差距在三個回合中始終顯著存在:
- T1:差距 21.71(p < .01)
- T2:差距 14.91(p < .01)
- T3:差距 10.30(p < .05)
雖然差距有縮小的趨勢,但在統計上依然顯著。平等 MTS 的水平協調從 T1 的 49.78 下降到 T3 的 41.77,而階層 MTS 從 28.07 略升到 31.48。兩者似乎在向某個穩態收斂,但收斂的速度不夠快,差距沒有消失。
從兩個相反的時間軌跡可以得出一個直接的推論,如果 MTS 將持續運作多個績效回合,階層結構的淨效益會隨時間轉為負值。 初期階段,認知保護效果可以部分抵消協調損害;後期階段,認知保護消失,協調損害持續存在。
從 MTS 到多 Agent AI 系統
我在讀這篇論文時,反覆注意到一個結構性的平行關係。多團隊系統面臨的「協調 vs 複雜性管理」權衡,與多 Agent AI 架構中集中式和分散式控制的選擇,在基本結構上高度相似。
在多 Agent AI 系統中,集中式架構(一個 orchestrator agent 統籌所有 sub-agent)對應階層式 MTS,分散式架構(agent 之間直接協調)對應平等式 MTS。集中式架構的優勢是降低了每個 sub-agent 需要處理的全域資訊量,減少了「認知負荷」(計算資源消耗)。劣勢是所有跨 agent 的資訊交換必須經過中央節點,通訊延遲增加,而且 orchestrator 本身會成為瓶頸和單點故障。
Matusik 等人的時間動態發現在這裡有直接的設計啟示。如果 sub-agent 在系統初始化階段需要中央協調來建立上下文理解(類似人類成員的基模形成),那麼一種漸進式放鬆的架構,初期集中式、後期分散式,在理論上應該能同時獲得認知保護的短期優勢和水平協調的長期優勢。
Greer, Abi-Esber, & Chu(2020)提出的「階層彈性」(Hierarchical Flexing)概念支持了這個思路。他們發現在獨立團隊中,在階層和平等之間刻意擺盪的做法,比固定採用任一種結構的表現更好。Lorinkova, Pearsall, & Sims(2013)的領導力研究提供了另一個平行證據,指導式領導在早期績效較高,賦權式領導在後期超越指導式。
實驗設計的特點與限制
這項研究使用了一個叫做 Leadership Development Exercise(LDX)的軍事模擬,1,060 名大學生被分配到 76 個 MTS 中(44 個階層式、32 個平等式),在 16×16 的格子地圖上執行為期 10 回合的目標識別和摧毀任務。
階層的操控不是單純的標籤差異。研究者在視覺組織圖、口頭指示、任務設計和角色分配透明度上都做了區分。在階層條件中,領導團隊擁有「最終決策權」,可以物理性地移動其他團隊放置的資產;在平等條件中,聯絡團隊只能提建議。這種多面向的操控增強了實驗的內部效度。
不過有幾個限制值得標記。
第一,樣本是大學生,不是實際的 MTS 工作者。大學生對權力和階層的心理反應可能與有豐富組織經驗的專業人士不同。
第二,認知耗竭是在模擬開始前測量的(使用自我報告量表),而水平協調是在任務執行期間即時測量的(行為數據)。這兩個變數的測量時機不一致,可能影響中介分析的精確性。
第三,實驗中的 MTS 成員在整個過程中保持穩定,但現實中的 MTS 常常有成員流動。成員流動可能打斷認知結構的累積,使得階層的認知保護效果持續更長時間。如果 Matusik 等人的衰減效應依賴於成員的穩定互動,那麼在高流動性的現實 MTS 中,衰減的速度可能更慢,階層的認知保護效果可能持續更久。
第四,這個研究只考察了權力階層(power hierarchy),沒有檢驗地位階層(status hierarchy)。Anderson & Brown(2010)區分了這兩種階層,它們的心理機制可能不同。
Ego Depletion 的複製危機
這裡有一個值得獨立討論的方法論問題。論文的認知耗竭構念(cognitive depletion)源自 Baumeister 等人的自我耗竭(ego depletion)理論,即自我控制依賴有限的心理資源,這些資源會隨使用而消耗。Hagger 等人(2010)的後設分析支持了這個效果。
然而,Hagger 等人(2016)在 Perspectives on Psychological Science 上發表了一項大規模預先註冊複製研究,發現效果量接近零。這意味著 ego depletion 的「強版本」——自控力是一種有限的、會被耗盡的資源——在心理學界面臨嚴重的複製危機。
Matusik 等人的構念並非嚴格的「自我控制耗竭」,而是更廣義的認知負荷和心理能量消耗。 在 MTS 的複雜環境中,成員需要處理大量的跨團隊資訊、進行持續的策略調整、管理人際關係的複雜性。這種廣義的認知負荷效果比嚴格的 ego depletion 更難受到複製危機的影響,因為它測量的是「做困難的事情很累」這個直覺上合理的現象,而不是「抵抗誘惑會消耗一種特定的心理資源」這個更具體且更有爭議的主張。
但這個理論基礎的不確定性仍然是一個需要注意的風險。如果認知耗竭的測量實際上捕捉的是其他構念(例如工作動機、情境壓力感知),那麼中介路徑的解釋就需要修正。
實務意涵與我的總結觀點
論文的實務建議可以歸納為兩個維度的決策矩陣。
第一個維度是過程相互依賴的程度。當跨團隊的活動高度交互依賴時(例如產科分娩團隊、McChrystal 描述的反恐行動),水平協調的重要性超過認知保護,平等結構是較好的選擇。當依賴程度較低時(匯集式或序列式依賴),階層的認知保護效果可能更有價值。
第二個維度是MTS 的預期持續時間。如果 MTS 是短期的臨時編組(ad hoc),成員沒有時間發展自己的認知結構,階層的認知保護效果可以在有限的運作週期內發揮作用。如果 MTS 將持續運作多個績效回合,初期的認知保護效果會消失,留下的只有協調損害。
我認為這篇論文的最大貢獻在於它揭示了一個反直覺的動態,組織結構的效果不是靜態的,同一個結構在不同時間點的淨效益可以從正轉負。 大多數組織研究使用橫截面設計(Cronin et al., 2011 曾指出這個問題),在 T1 時點的研究會得出「階層有利有弊」的結論,到了 T3 時點,結論應該修正為「階層的弊大於利,因為唯一的好處已經消失」。
這對組織設計的啟示是,選擇組織結構時需要考慮的核心重點在於「在這個系統的生命週期中,結構的效果會如何演變」,而非靜態地比較「哪種結構更好」。對多 Agent AI 系統的設計同樣如此,固定的架構決策可能在某個時間點是最優的,但隨著系統狀態的演進而成為約束。