我有一个USQL脚本和CSV提取器来加载我的文件.但是有些月份文件可能包含4列,有些月份可能包含5列.如果我使用4或5个字段的列列表设置我的提取器,我会收到有关文件预期宽度的错误.去检查分隔符等等.毫不奇怪.这个问题...

我有一个USQL脚本和CSV提取器来加载我的文件.但是有些月份文件可能包含4列,有些月份可能包含5列.
如果我使用4或5个字段的列列表设置我的提取器,我会收到有关文件预期宽度的错误.去检查分隔符等等.毫不奇怪.
这个问题的解决方法是什么,因为USQL仍然是一个新手并且缺少一些基本的错误处理?
我已经尝试在提取器中使用silent子句忽略更宽的列,这对4列很方便.然后获取具有IF条件的行集的行计数,然后该条件具有5列的提取器.然而,这导致行集变量的世界不被用作IF表达式中的标量变量.
我还尝试了C#样式计数和sizeof(@ AttemptExtractWith4Cols).都没有工作.
代码片段让您了解我正在采取的方法:
DECLARE @SomeFilePath string = @"/MonthlyFile.csv";
@AttemptExtractWith4Cols =
EXTRACT Col1 string,
Col2 string,
Col3 string,
Col4 string
FROM @SomeFilePath
USING Extractors.Csv(silent : true); //can't be good.
//can't assign rowset to scalar variable!
DECLARE @RowSetCount int = (SELECT COUNT(*) FROM @AttemptExtractWith4Cols);
//tells me @AttemptExtractWith4Cols doesn't exist in the current context!
DECLARE @RowSetCount int = @AttemptExtractWith4Cols.Count();
IF (@RowSetCount == 0) THEN
@AttemptExtractWith5Cols =
EXTRACT Col1 string,
Col2 string,
Col3 string,
Col4 string,
Col5 string
FROM @SomeFilePath
USING Extractors.Csv(); //not silent
END;
//etc
当然,如果在USQL中存在TRY CATCH块这样的事情,那将会容易得多.
这甚至是一种合理的方法吗?
任何投入将不胜感激.
感谢您的时间.
解决方法:
U-SQL现在支持OUTER UNION,所以你可以像这样处理它:
// Scenario 1; file has 4 columns
DECLARE @file1 string = @"/input/file1.csv";
// Scenario 2; file has 5 columns
//DECLARE @file1 string = @"/input/file2.csv";
@file =
EXTRACT col1 string,
col2 string,
col3 string,
col4 string
FROM @file1
USING Extractors.Csv(silent : true)
OUTER UNION ALL BY NAME ON (col1, col2, col3, col4)
EXTRACT col1 string,
col2 string,
col3 string,
col4 string,
col5 string
FROM @file1
USING Extractors.Csv(silent : true);
@output =
SELECT *
FROM @file;
OUTPUT @output
TO "/output/output.csv"
USING Outputters.Csv();
在我的示例中,file1有4列,file2有5列.该脚本在任一方案中都成功运行.
我的结果:
希望有道理.
本文标题为:c# – 在USQL中处理具有不同列的文件


基础教程推荐
- c# – 在Windows应用商店应用中使用旧版dll(.NET)? 2023-09-19
- Unity 使用TexturePacker打包图集的操作方法 2023-04-27
- C#操作SQLite数据库方法小结 2023-06-14
- C#实现简易计算器小功能 2023-05-16
- C#/VB.NET实现创建PDF/UA文件的示例代码 2023-07-04
- C#.NET Core 2.1跨度和内存性能注意事项 2023-09-26
- 比Math类库abs()方法性能更高的取绝对值方法介绍 2023-01-22
- 基于C#实现简易的键盘记录器 2023-06-28
- VS2019打包WPF安装程序最新教程(图文详解) 2023-02-03
- C# Any()和AII()方法的区别 2023-06-21