scripts/rokae/brake/robot_brake_with_comment.py

# coding: utf-8
import os
import pandas as pd
import openpyxl
from win32com.client import DispatchEx
import time


def just_open(filename):
    """
    功能：为了让有公式的excel计算出数值，进而做下一步处理
    参考：
        1. https://blog.csdn.net/claria029/article/details/116486904
        2. https://blog.csdn.net/zhfak/article/details/125382349
    参数：文件路径，一定是 r'D:\\Syncthing\\company\\D-测试工作\\X-自动化测试\\01-制动数据处理\test.xlsx' 的格式
    返回值：无
    """
    xlApp = DispatchEx("Excel.Application")
    xlApp.Visible = False
    xlBook = xlApp.Workbooks.Open(filename)
    xlApp.DisplayAlerts = 0
    xlBook.SaveAs(filename)
    xlBook.Close()


def traversal_files(path):
    """
    功能：以列表的形式分别返回指定路径下的文件和文件夹，不包含子目录
    参数：路径
    返回值：无
    """
    dirs = []
    files = []
    for item in os.scandir(path):
        if item.is_dir():
            dirs.append(item.path)
        elif item.is_file():
            files.append(item.path)

    return dirs, files


def find_row_start(excel_file, ws_data, conditions):
    """
    函数功能：查找数据文件中有效数据的行号
    :param excel_file: excel 文件的路径
    :param ws_data: excle 中数据页的指针
    :param conditions: 通过路径特征提取出来的信息，比如 ['reaach100', 'speed66']
    :return: 有效数据的起始行行号
    """
    global AV
    global RR
    ratio = float(conditions[1].removeprefix('speed'))/100
    speed_max = AV * ratio * RR / 6

    row_max = ws_data.max_row
    row_start = row_max - 1000

    while row_start > 0:
        _a = ws_data[f"A{row_start}"].value
        _b = ws_data[f"A{row_start - 200}"].value
        if abs(_a-speed_max) < 50 and abs(_b-speed_max) < 50 and abs(_a - _b) < 70:
            row_start -= 200
            break
        else:
            row_start -= 200
    else:
        print(f"{excel_file.replace('xlsx', 'data')}, 这个文件数据有问题，请检查......")
        os.remove(excel_file)
        exit(9)

    return row_max, row_start


def find_result_sheet_name(conditions, count):
    # 该函数比较简单，功能是获取结果文件准确的sheet页名称
    # 33%臂展_33%速度_正1
    reach = conditions[0].removeprefix('reach')
    speed = conditions[1].removeprefix('speed')
    result_sheet_name = f"{reach}%臂展_{speed}%速度_正{count}"

    return result_sheet_name


def copy_data_to_result(ws_data, ws_result, row_max, row_start):
    """
    函数功能：将数据文件中有效数据拷贝至结果文件对应的 sheet
    :param ws_data: excle 中数据页的指针
    :param ws_result: 结果文件对应 sheet 的指针
    :param row_max: 数据文件中获取到的最后一行的行号
    :param row_start: 数据文件中获取到的第一行有效行的行号
    :return: -
    """
    # 结果文件数据清零
    for row in ws_result.iter_rows(min_row=2, min_col=1, max_row=6000 - row_start + 2, max_col=2):
        for cell in row:
            cell.value = None

    # 将合适的数据复制到结果文件
    data = []
    for row in ws_data.iter_rows(min_row=row_start, min_col=1, max_row=row_max, max_col=2):
        for cell in row:
            data.append(cell.value)
    i = 0
    for row in ws_result.iter_rows(min_row=2, min_col=1, max_row=row_max - row_start + 2, max_col=2):
        for cell in row:
            cell.value = data[i]
            i = i + 1


def copy_data_to_excel_file(wb_data, ws_result, row_max, row_start, excel_file):
    """

    :param wb_data: excel 的指针
    :param ws_result: 结果文件对应 sheet 的指针
    :param row_max: 数据文件中获取到的最后一行的行号
    :param row_start: 数据文件中获取到的第一行有效行的行号
    :param excel_file: excel 文件的路径
    :return: wb_data 是新打开的 excel 文件的指针，ws_dp 是新打开的 excel 文件中的 dp 页指针
    """
    try:
        del wb_data['dp']
        wb_data.create_sheet('dp')
        ws_dp = wb_data['dp']
    except:
        wb_data.create_sheet('dp')
        ws_dp = wb_data['dp']

    data = []
    for row in ws_result.iter_rows(min_row=1, min_col=1, max_row=row_max-row_start+2, max_col=5):
        for cell in row:
            data.append(cell.value)
    i = 0
    for row in ws_dp.iter_rows(min_row=1, min_col=1, max_row=row_max-row_start+2, max_col=5):
        for cell in row:
            cell.value = data[i]
            i = i + 1

    global RC
    global RR
    ws_dp.cell(row=5, column=7).value = RC
    ws_dp.cell(row=6, column=7).value = RR

    wb_data.save(excel_file)
    just_open(excel_file)  # 为了能读取到公式计算的数值，必须要用 win32com 打开关闭一次
    wb_data = openpyxl.load_workbook(excel_file, data_only=True)
    ws_dp = wb_data['dp']

    return wb_data, ws_dp


def find_row_start_dp(ws_dp, row_max, row_start, conditions):
    """
    函数功能：获取结果文件 G2 单元格的数据值
    :param ws_dp: excel 中新建 sheet 的指针
    :param row_max: 数据文件中获取到的最后一行的行号
    :param row_start: 数据文件中获取到的第一行有效行的行号
    :param conditions: 通过路径特征提取出来的信息，比如 ['reaach100', 'speed66']
    :return: 返回 excel 中 dp 这个 sheet 中的有效数据行号，并做了加工处理，因为结果文件的部分属性
    """
    global AV
    ratio = float(conditions[1].removeprefix('speed'))/100
    av_max = AV * ratio
    row_max_dp = row_max - row_start + 1 + 1  # title row
    row_start_dp = row_max_dp - 5
    print(f"row_start_dp = {row_start_dp}")
    while row_start_dp > 1:
        # 处理异常数据：当从数据文件中拷贝的有效数据超过5000时，会触发该代码块
        if ws_dp.cell(row=row_start_dp, column=4).value is None:
            row_start_dp -= 100
            continue
        # 确认数据有效后，开始查找 G2 的值，这里使用到的原理是：
        # 1. 计算连续 5 个点的平均值
        # 2. 和当前测试条件下的最大值做差，如果绝对值在 1 之内，则认定获取到了该值
        _a = float(ws_dp.cell(row=row_start_dp, column=4).value)
        _b = float(ws_dp.cell(row=row_start_dp - 1, column=4).value)
        _c = float(ws_dp.cell(row=row_start_dp - 2, column=4).value)
        _d = float(ws_dp.cell(row=row_start_dp - 3, column=4).value)
        _e = float(ws_dp.cell(row=row_start_dp - 4, column=4).value)
        avg = (_a + _b + _c + _d + _e) / 5
        if abs(avg - av_max) < 1:
            row_start_dp = row_start_dp + 10 - 5  # +10 是因为结果文件 C2 的值是 10，-5是做了保守处理，相当于再往前移动 5 个点位
            break
        else:
            row_start_dp -= 5  # 保守一点，每次移动 5 个点位，如果想要加快程序运行，可适当调整更大一些，建议不超过 15
    else:
        print("数据有误，请确认！")
        print("未找到平衡的点")
        exit(1)

    return row_start_dp


def single_file_process(data_file, wb_result, count):
    """
    函数功能：完成单个数据文件的处理：
        1. 将 .data -> .xslx（excel）
        2. 根据文件路径特征，获取到结果文件准确的 sheet name
        3. 找到数据文件有效的起始点位置
        4. 将有效数据 copy 到结果文件对应的 sheet 中的对应位置
        5. 结果文件对应 sheet 中会根据公式生成一部分数据，需要将这部分数据 copy 到 excle 中
        6. 将 excel 处理一下，获取合适的开始点位置，这个开始点指的是要写入结果文件中的 G2 单元格的值
        7. 写入正确的值，int 类型
    :param data_file: 数据文件，数据处理的最小单位
    :param wb_result: 结果文件的指针，可以理解为打开的结果文件的句柄，从该变量引用到其他sheet
    :param count: 计数器，对应急停的 1/2/3 次
    :return: -
    """
    excel_file = data_file.replace('data', 'xlsx')
    sheet_name = data_file.split('\\')[-1].removesuffix('.data')
    df = pd.read_csv(data_file, sep='\t')
    df.to_excel(excel_file, sheet_name=sheet_name, index=False)

    conditions = sorted(data_file.split('\\')[-2].split('_')[1:])
    print(f"conditions = {conditions}")
    result_sheet_name = find_result_sheet_name(conditions, count)
    ws_result = wb_result[result_sheet_name]

    wb_data = openpyxl.load_workbook(excel_file)
    ws_data = wb_data[sheet_name]
    row_max, row_start = find_row_start(excel_file, ws_data, conditions)

    copy_data_to_result(ws_data, ws_result, row_max, row_start)
    wb_data, ws_dp = copy_data_to_excel_file(wb_data, ws_result, row_max, row_start, excel_file)
    row_start_dp = find_row_start_dp(ws_dp, row_max, row_start, conditions)

    ws_result["G2"] = int(row_start_dp)

    wb_data.save(excel_file)
    wb_data.close()


def data_process(result_file, raw_data_dirs):
    """
    函数功能：完成一个结果文件的数据处理
    :param result_file: 每次处理一个结果文件
    :param raw_data_dirs: 传入所有的数据文件夹，做筛选
    :return: -
    """
    prefix = result_file.split('\\')[-1].split('_')[0]
    print(f"prefix = {prefix}")
    print(f"raw_data_dirs = {raw_data_dirs}")
    wb_result = openpyxl.load_workbook(result_file)  # 打开和关闭结果文件夹十分耗时间
    for raw_data_dir in raw_data_dirs:
        if raw_data_dir.split('\\')[-1].split('_')[0] == prefix:
            print(f"正在处理【{raw_data_dir}】中的数据......")
            _, data_files = traversal_files(raw_data_dir)
            count = 1  # 计数器，对应三次急停数据
            for data_file in sorted(data_files):
                print(f"正在处理【{data_file}】....")
                print(f"count = {count}")
                single_file_process(data_file, wb_result, count)
                count += 1

    wb_result.save(result_file)
    wb_result.close()


def check_files(raw_data_dirs, result_files):
    if len(result_files) != 3:
        print("结果文件数目错误，请参考 readme.txt 中的规则。")
        exit(3)

    prefix = []
    for result_file in result_files:
        prefix.append(result_file.split('\\')[-1].split('_')[0])
    if not sorted(prefix) == sorted(['load33', 'load66', 'load100']):
        wd = result_file.split('\\')
        del wd[-1]
        wd = '\\'.join(wd)
        print(f"请关闭所有相关数据文件，并检查工作目录【{wd}】下，有且只允许有类似如下三个文件：")
        print("1. load33_自研_制动性能测试.xlsx")
        print("2. load66_自研_制动性能测试.xlsx")
        print("3. load100_自研_制动性能测试.xlsx")
        exit(8)
    for raw_data_dir in raw_data_dirs:
        prefix = raw_data_dir.split('\\')[-1].split('_')[0]
        if prefix not in ['load33', 'load66', 'load100']:
            print(f"报错信息：数据目录【{raw_data_dir}】不合规，请参考如下形式。")
            print("命名规则：\n\t1. loadAA_speedBB_reachCC\n\t2. loadAA_reachBB_speedCC")
            print("规则解释：AA/BB/CC 指的是负载/速度/臂展的比例，比如 load66_speed100_reach33 意思是 66% 负载，100% 速度以及 33% 臂展情况下的测试结果文件夹。")
            exit(7)
        _, raw_data_files = traversal_files(raw_data_dir)
        if len(raw_data_files) != 3:
            print(f"数据目录【{raw_data_dir}】下数据文件个数错误，每个数据目录下有且只能有三个以 .data 为后缀的数据文件。")
            exit(6)
        for raw_data_file in raw_data_files:
            if not raw_data_file.split('\\')[-1].endswith('.data'):
                print(f"数据文件【{raw_data_file}】后缀错误，每个数据目录下有且只能有三个以 .data 为后缀的数据文件。")
                exit(5)
    print("数据目录合规性检查结束......")


def delete_excel_files():
    global data_dir
    raw_data_dirs, _ = traversal_files(data_dir)
    for raw_data_dir in raw_data_dirs:
        _, raw_data_files = traversal_files(raw_data_dir)
        for raw_data_file in raw_data_files:
            if raw_data_file.endswith('.xlsx'):
                os.remove(raw_data_file)


def main():
    time_start = time.time()  # 记录开始时间

    global data_dir
    raw_data_dirs, result_files = traversal_files(data_dir)
    print("#调试信息======================================")
    print(f"结果文件：{result_files}")
    print(f'数据目录：{raw_data_dirs}')
    check_files(raw_data_dirs, result_files)

    for result_file in result_files:
        print(f"正在整理【{result_file}】文件的数据......")
        data_process(result_file, raw_data_dirs)

    delete_excel_files()  # 运行结束之后，删除中间临时文件

    time_end = time.time()  # 记录结束时间
    time_total = time_end - time_start  # 计算的时间差为程序的执行时间，单位为秒/s
    print(f"数据处理时间：{time_total//3600:02} h {time_total % 3600/60:05.2f} min")

# 定义初始参数，数据文件夹路径/最大角速度/减速比/额定电流
global data_dir
global AV
global RR
global RC
data_dir = r'D:\Syncthing\company\D-测试工作\X-自动化测试\99-Data\j1'
AV = 180  # AV for Angular velocity
RR = 120  # RR for Angular velocity
RC = 5.6  # RC for Rated Current

if __name__ == "__main__":
    main()