该参数不能配置过大,当配置过大,有可能会因为推理过程中显存的波动导致显存OOM问题,建议配置低于0.9。在代码中添加该警告提示(当配置的gpu_memory_utilization大于或等于0.95时,通过console_logger输出警告信息到终端)