当新冠开始传播时,汽车行业受到了严重的经济冲击。在疫情爆发初期,一些地区对新车的需求下降了80%,中国、欧洲和北美90%以上的汽车工厂在危机最严重时关闭。
不到两年后,随着疫苗的出现和经济的增强,情况发生了逆转。事实上,汽车销售的反弹速度比预期的要快,使得OEM难以满足需求。主要制约因素不是产能不足,而是缺乏能够实现高级驾驶辅助系统和联网汽车功能,如在线导航和信息娱乐的精密半导体。
严峻形式下,一些汽车制造商已经停止生产某些汽车或放慢生产线。其他OEM只是在制造汽车外壳,并等待在以后添加需要半导体的系统。还有一些人删除了车辆的某些功能。
当汽车销量开始激增时,汽车制造商自然会增加他们的芯片订单,但晶圆厂需要提前数月至数年预订生产线。到 OEM 来电时,晶圆厂已经将大部分产能分配给其他领域的业务,例如消费电子产品,因此不可能立即转向新订单。即使有更多产能可用,OEM仍可能会发现自己处于停滞状态,因为复杂设置和制造过程,新批次的芯片需要六到九个月的时间。
由于汽车需求强劲,晶圆厂有很大的动力来缩短交货时间。但对于制造6英寸和8英寸晶圆的成熟晶圆厂来说,这可能是困难的,因为它们设备往往更旧,效率更低。通过新设施和工具设置提高自动化和扩大生产有助于缩短生产时间,但即使在现代设施中实施也具有挑战性且耗时。为了更快地提高生产力,成熟的晶圆厂可以采用更严格、更全面的方法重点关注四项关键活动:提高整体设备效率 (OEE)、主动管理劳动力、简化基础设施和动态管理性能。这些技术中的一些在其他行业甚至在半导体行业的某些部门中广为人知,但在成熟的晶圆厂中并不常见。 日益严重的供需失衡 到 2019 年,汽车行业占半导体总销售额的近 10%,创造了约 410 亿美元的收入。由于半导体行业已经开始依赖OEM来获得强劲而稳定的收入来源,因此很快就感受到了疫情期间汽车销量下降的影响。
当汽车需求下降时,OEM和半导体分销商推迟了新订单,只在库存不足时才采购。这种犹豫在平时可能是谨慎的,但它让许多OEM没有做好准备,无法应对汽车需求从近期低点快速激增。尽管一些成熟的晶圆厂可能会试图通过增加产能来缓解短缺,但产能提升需要六个月或更长时间。他们可以尝试提高效率以获取一些早期的收益,但过去的大多数努力都遇到了意想不到的问题。根据我们与多家晶圆厂合作的经验,这些问题源于四种类型。
一、错过了增加产能的机会。因为成熟的晶圆厂数据基于旧的配方或工具能力,因此其往往缺乏对其全部产能的全面了解。例如,有些人可能低估了可能的工具正常运行时间的真实数量,是因为它它们会导致缓冲区过多。其他人难以计算容量,因为他们在计算中使用过时的信息,不考虑产品组合的变化,或者不优化工具的层分配。这些问题非常复杂,以至于即使晶圆厂正在寻找增加产能的策略,也无法确定他们的额外产能。
二、劳动管理。劳动力部署通常没有得到一致或正确的跟踪和衡量,导致工具组分配不理想,劳动力利用不足,以及对提升所需的全职等效工时缺乏了解。此外,对于新工具带来的变化,传统的劳动力配置可能不是最佳的,例如,由于地板布局要求员工步行到其他隔间来操作新设备,因此会导致非增值时间。另一个常见的挑战与灵活性有关,因为在瓶颈转移和人员配备需求出现时,没有适当交叉培训多个工具的操作员无法重新分配到不同的站点。如果员工士气低落,对劳动力变化的适应能力较差,那么任何效率低下的情况都会变得更加复杂。
三、依赖较旧的设施、系统和工具。在大多数成熟的晶圆厂,相同的机器和设备已经运行了 20 多年,这导致频繁故障和生产损失的风险更大。大多晶圆厂很少评估机器性能并忽视早期预警信号。因为历史上降低成本的措施会延迟对关键系统的投资。因此,许多成熟的晶圆厂也缺乏所需的冗余,而这些关键系统本应根据产量和技术变化扩大规模。除了基础设施问题之外,成熟的晶圆厂往往与供应商签订了低于标准的备件管理安排和服务合同,这可能导致更多的停机时间。例如,合同可能未指定补偿将部分基于机器正常运行时间。
四、需要更主动的绩效管理。绩效管理是各班次产出变化的最大驱动因素之一。对于每个班次和工具组,目标通常不是在制造车间层面或更详细的层面上确定的。现场领导可能缺乏进行有效日常绩效对话、调整优先级、跟踪部署、轮班开始和结束时间以及休息所需的关键管理技能的培训。此外,难以从一个班传递到另一个班、冗余的质量检查和不必要的手动数据记录都会导致性能不一致。最后,楼层领导可能缺乏有关关键目标的信息,使他们难以确定优先事项。 提高效率的新方法 影响过去提高晶圆厂效率的挑战今天仍然存在,但成熟的晶圆厂可以通过专注于四项任务来消除其中的许多问题。
提高整体设备效率并消除工具瓶颈
大多数成熟的晶圆厂都知道他们有性能问题,需要更多关于根源的信息。为了开发解决其特定问题的解决方案,他们必须超越一般化,并确定在工具级别出现瓶颈的方式和位置。更重要的是,他们必须考虑当产品组合发生变化时这些瓶颈可能如何变化,因为困扰一个制造过程的问题可能在另一个过程中不存在。
要深入了解瓶颈,需要一些平凡但关键的基础工作:列出所有工具,以及每个工具的产品、配方步骤和晶圆输出(当前和计划)。工程和规划团队应该能够提供大部分信息,晶圆厂可以使用这些信息来确定实际和所需的产能。在估算原始处理时间时,晶圆厂用详细的地面观测值补充工程数据和配方。这可以揭示为什么工具和制造步骤之间存在差异。例如,晶圆厂可能会发现一次性工具设置没有改变,导致效率低下,或者晶圆上的氧化层在厚度和均匀性不同。
然后,晶圆厂应检查 OEE 基准,该基准显示每个工具的最大产能,使用双支柱方法将理论最大产能与实际产量进行比较(图表 1)。为了确定导致产能欠佳的具体因素,晶圆厂经理可以检查数据日志、采访关键员工并进行现场观察。这项研究将帮助他们量化停机时间、确定设备速度并发现其他问题,例如低效的转换时间。在一个案例中,工具级分析显示,晶圆厂的晶圆产量比其真实产能低 43%。
发现问题后,公司将能够启动改进计划。其中一些最重要的原则涉及单分钟换模(SMED)原则,该原则要求在机器运行时尽可能执行设备转换步骤。
SMED 原则在前沿晶圆厂中很常见,也规定应简化任何剩余的工艺步骤。例如,一家调查减少预防性维护(PM)时间策略的工厂发现,其紧固过程过长,因为员工在安装护罩夹和修理弯曲护罩时使用了不正确的工具。该公司还缺乏更换盖罩的平台,使拆卸和安装变得复杂,并且随意存放六角工具,使其难以找到。同时,反复出现的流量传感器错误和可编程逻辑控制器错误导致频繁停机和重启。当工厂解决这些问题以及其他出现的问题时,它能够将总 PM 停机时间减少 6 小时 (23%)。
积极管理劳动力
传统上,晶圆厂改变他们的生产系统是为了应对问题,而不是试图预测问题。他们还倾向于优先考虑降低成本而不是提高效率。随着对汽车芯片的迫切需求,是时候采取一种更积极、更系统的方法,专注于最大限度地提高产能,而不是控制短期支出。
作为第一步,晶圆厂应建立端到端生产流程模型,并注意每个步骤的技术约束。然后,他们可以确定最佳的人员配备和生产排序选择。在某些情况下,他们可能需要每周重新考虑批量大小和顺序。
使用一个模型,一家公司在为期 10 天的概念验证试验测试新安排之前,改变了生产步骤和人员配置。一些简单的调整,例如在员工之间重新分配工作和安排午餐时间,将产量提高了 30%,将生产力提高了 10%,并提高了蚀刻工具的利用率,质量和安全没有改变。
另一家检查其工作流程的公司专注于改善操作员接触时间——员工花在设备上的时间(而不是无关的活动,例如等待产品到达生产线以及从工厂的一个部分走到另一个)。该公司观察了一个隔间内的所有技术人员,以了解操作员如何度过他们的一天。分析数据后,它确定触摸时间仅占操作员时间的31%。为了提高生产率,公司重新平衡了工作量,并将一些员工调到另一个工作间。它还做了一些其他更改,例如提供中断覆盖。随着这些变化,接触时间增加到46%。
通过预测性维护降低基础设施风险
在成熟的设施中,机器故障和其他基础设施问题非常常见,,以至于fabs可能难以确定PM最有保障的位置,或者哪些机器应该首先进行维修。在设置优先级时,晶圆厂可以通过确定最关键工具的结构化方法来最小化风险并减少基础设施故障的影响。例如,通常应优先考虑使用率高、容量低且无备份的机器。类似的过程适用于系统,如配电和排烟系统。在这种情况下,最优先考虑的是系统,对于这些系统,停工将对生产产生直接和严重的后果,特别是在其故障可能性很高的情况下。
在分析系统时,晶圆厂应独立查看所有子系统。一家想要改进其工艺冷却水系统的公司首先分别检查了大约 17 个子系统(图表 2)。从办公室泵到冷却盘管,它举办了研讨会,采访了供应商,并进行了专家检查。该公司还为每个子系统确定了可能的故障模式,例如油冷凝、冷水机维护不足和压缩机泵故障。
来源:麦肯锡
这些评估表明,四个子系统需要高度关注。Fab A 和 Fab B 冷却器在夏季都没有备份,之前都发生过故障。由于承包商通常需要 24 到 48 小时进行维修,因此此类故障后不可避免地会出现大量停机。Fab A 和 Fab B 冷却塔也有类似的问题。对于这两个子系统,最常见的故障是风扇故障、冷却系统性能下降,并对生产产生直接影响。
在确定主要问题后,该公司制定了缓解计划,描述了降低所有四个子系统风险的步骤,例如如调查管道系统以了解Fab A冷却器最近发生故障的原因,并与供应商合作确定需要库存的关键备件。除了讨论需要采取什么行动外,缓解计划还规定了不同任务的责任,并规定了完成的时间表。
通过采用强有力的预测性维护程序,而不是随意应对危机,公司可以将停机时间减少30%至50%。确实发生的停机时间将是有计划的,而不是意外的,因此,晶圆厂将有机会在其他地方部署工人。零部件短缺也将不太常见,因为晶圆厂将很清楚他们需要什么来进行定期维护。
实施动态绩效管理
在许多成熟的晶圆厂,性能管理是随意的。为了改进,他们需要一种具有明确车间指标和目标的新方法。例如,有些人可能会量化轮班和休息期间产出下降的程度,然后设定改进目标。现在在许多现代设施中使用的性能仪表板可以帮助成熟的晶圆厂确定任何问题的根本原因。
动态绩效管理的其他重要元素包括:
清晰的问题解决流程。晶圆厂应创建工作辅助工具,例如模板和清单,以促进不同的流程并改善轮班交接。还应该有一个明确的过程来处理不断升级的问题。
培训。楼层领导可能习惯于更非正式的绩效对话过程,并需要就指标和目标进行培训。理想情况下,晶圆厂将对任何新工艺进行试运行,并征求运营商关于哪些有效以及哪些需要改变的反馈。然后,他们可以在扩大规模之前进行更改。
定期对话。操作员和主管应在每班结束时在白板前进行约 5 到 10 分钟的对话。他们可以有一个标准的议程并记录任何出现的问题以供以后讨论。领导者应该记住,提供积极的反馈与在绩效对话中审查问题一样重要。
自动化仪表板和动作跟踪。晶圆厂最初可能使用手动仪表板,但最终可以将它们自动化以节省时间并提高透明度。理想情况下,仪表板应该包含便于查看和解释关键数据的视觉效果,这些数据应该经常更新。
在员工习惯于长期流程的晶圆厂,最大的实施障碍可能涉及心态和行为。从历史上看,鉴于成熟晶圆厂注重降低成本,对提高产量的做法的重要性一直很低,大多数领导者都倾向于忽视它们。为了获得最佳结果并保持进步,领导者应确保通过就组织的近期优先事项进行清晰的沟通,直接解决思维定势问题。
随着车辆变得越来越复杂、电气化和自动驾驶,它们的半导体含量将增加到更高的水平。这可能会加剧当前汽车芯片的短缺,导致OEM的生产进一步放缓。成熟的晶圆厂无法在一夜之间解决汽车半导体的严重短缺问题,但他们现在可以采取措施开始缓解这个问题。