我有一个C函数:
Node * first_element_by_path(const Node * node, const char * path, char delimiter);
还有一个防锈胶功能:
pub fn first_element_by_path(node: *mut CNode, path: *const c_char, delimiter: c_char) -> *mut CNode;
它期望一个c_char
as分隔符.我想发送一个char
,但它c_char
是一个i8
而不是一个char
.如何将Rust转换char
为i8
或者c_char
在这种情况下?
你在问这个问题:
如何将32位数字拟合为8位值?
哪个有直接答案:"丢掉大部分位":
let c = rust_character as libc::c_char;
但是,这应该让你停下来问问题:
其余位是否正确编码?
那些丢弃的东西怎么样?
Rust char
允许编码所有Unicode标量值.您对此代码的期望行为是什么:
let c = '' as libc::c_char;
它可能不是创建值-87
,非ASCII值!或者这个不那么愚蠢,也许更现实的变体,它是-17
:
let c = 'ï' as libc::c_char;
然后你必须问:C代码对一个角色意味着什么?C代码认为字符串是什么编码?C代码如何处理非ASCII文本?
最安全的事情可能是断言该值在ASCII范围内:
let c = 'ï'; let v = c as u32; assert!(v <= 127, "Invalid C character value"); let v = v as libc::c_char;
您也可以返回一个Result
表示该值超出范围的类型,而不是断言.
我应该更改我的功能(将调用胶水功能的那个)来接收
c_char
而不是char
?
那要看.这可能只是将问题进一步推向堆栈; 现在每个调用者都必须决定如何创建c_char
并担心128到255之间的值.如果代码的语义是这样的,那么值必须是ASCII字符,那么在你的类型中编码.具体来说,你可以使用类似ascii crate的东西.
在任何一种情况下,你都会将失败的可能性转移到别人的代码中,这会让你的生活变得更加容易,这可能会让调用者更加沮丧.